{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Потрясающий дебют OpenAI в области создания видео Sora ощущается как выпуск GPT-4

OpenAI продемонстрировал свою первую генеративную модель искусственного интеллекта для видео под названием Sora, и, судя по всему, это похоже на фееричный момент выпуска GPT-4, только в сфере генерации видео.

OpenAI анонсировала Sora, первую в компании модель преобразования текста в видео, в сообщении в блоге и на X, ранее Twitter, который заблокирован в РФ. Sora демонстрирует впечатляющий набор возможностей, включая возможность создавать видеоролики продолжительностью до минуты, которые могут похвастаться беспрецедентным уровнем визуальной точности и, что наиболее важно, стабильностью. При этом - согласно информации OpenAI - нейросеть четко соблюдает инструкции пользователя.

Модель искусственного интеллекта теперь доступна избранной группе red teamers для оценки рисков ИИ, а также художникам-визуалистам, дизайнерам и кинематографистам, которые хотят оставить отзыв, чтобы улучшить ее полезность для профессионалов этих сфер.

OpenAI рассматривает Sora как базовую модель на пути к AGI

Согласно OpenAI, текущие ограничения Sora заключаются в необходимости точного моделирования сложной физики, а так же обучение более точному изучению конкретных причинно-следственных сценариев.

Например, персонаж может откусить печенье, но визуальный эффект - след от укуса - может отсутствовать. Sora также может сбиваться с пространственных деталей, таких как различение левого и правого, и затрудняться с подробным описанием событий с течением времени, например, с отслеживанием траектории камеры.

Что касается безопасности, OpenAI реализует несколько стратегий, прежде чем интегрировать Sora в свои продукты. Это включает в себя работу с red teamers и разработку инструментов, таких как классификатор обнаружения, позволяющий определить, когда видео сгенерировано с помощью Sora.

Они намерены включить метаданные C2PA в будущем, предполагая, что модель будет использоваться в продукте OpenAI. Основываясь на методах безопасности, установленных для DALL-E 3, OpenAI планирует использовать текстовые классификаторы для проверки подсказок, нарушающих политику содержания, и графические классификаторы для проверки видеокадров на соответствие политике использования.

Sora - это диффузионная модель, которая работает путем постепенного преобразования статичных, зашумленных видео в четкие. Представляя видео в виде наборов фрагментов данных, похожих на токены GPT, модель может работать с более широким спектром визуальных данных, чем это было возможно ранее, говорят в компании.

Используя методы воспроизведения из DALL-E 3, Sora может более точно воспроизводить текстовые инструкции в созданных видеороликах. Временная стабильность поколения Sora стала возможной благодаря тому, что система "позволяет модели заглядывать вперед на много кадров единовременно".

OpenAI рассматривает Sora как основополагающую модель, "которая может понадобиться и моделировать реальный мир", что является важным шагом на пути к созданию общего искусственного интеллекта (AGI).

ps. Комментируйте и лайкайте, пожалуйста! Это помогает продвижению статьи.

Ну и как положено, канал тг))) Канал и чатик

Там в закрепленном боты KolerskyAi для доступа в Chat GPT и Dalle-3 без VPN и другие нейросети.

0
4 комментария
Ефим Т.

когда уберут косяки типо плывущего носа и двух левых лап это будет реальный прорыв

Ответить
Развернуть ветку
Евгений Вилков
Автор

Думаю быстро исправят. Еще пол года все генераторы картинок делали людей с 6-8 пальцами на руке) Теперь такой проблемы нет 😀

Ответить
Развернуть ветку
Вячеслав Макаров

Al осталось убрать только проблемы с физиологией человека и все, это идеальный инструмент!

Ответить
Развернуть ветку
Максим Клименко

Будем надеяться, что Sora приведет к еще более удивительным результатам

Ответить
Развернуть ветку
1 комментарий
Раскрывать всегда