5 особенностей Sora от OpenAI, о которых вы, вероятно, не знали

Sora, революционный видеогенератор ИИ от OpenAI, в последнее время набирает огромную популярность в мире ИИ благодаря своей способности создавать высококачественное видео из простых текстовых запросов.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Но возможности Sora простираются далеко за пределы создания видео из текстовых промптов. Вот пять примеров:

Изменение стиля окружающей обстановки в видеороликах
Генерация изображений
Превращение изображений в видео
Интерполяция двух видео
Расширение существующих видеороликов

Давайте подробнее рассмотрим каждую из этих функций.

Представьте, что вы берете современное видео и плавно превращаете его в сцену из 1920-х годов, с классическими автомобилями и старинными зданиями.

Посмотрите на этот пример: верхний видеоролик в качестве исходных данных и получившееся видео в нижней части с помощью следующего промпта:

Change the setting to the 1920s with an old school car. make sure to keep the red color

Качество работы Sora можно назвать революционным! Это открывает умопомрачительные возможности. Вот несколько из них:

Кинопроизводство. Значительно снижает стоимость за счет трансформации сцен под любую эпоху или стиль.
Образование. Визуальное воссоздание исторических событий или периодов позволяет погрузиться в процесс обучения.
Реклама. Позволяет создавать уникальный контент, размещая товары в различных обстановках.

Sora не ограничивается только созданием видео. Она также может генерировать изображения с разрешением до 2048 x 2048 пикселей.

Она работает путем расположения пятен гауссовского шума в пространственной сетке с временной протяженностью в один кадр.

Вот пример:

Промпт: A snowy mountain village with cozy cabins and a northern lights display, high detail and photorealistic dslr, 50mm f/1.2

Теперь сравните результат Sora с изображением, сгенерированным DALL-E 3 с помощью того же промпта.

На мой взгляд, изображение, созданное Sora, выглядит лучше. Кажется, что он ярче передает магию северного сияния. Вы согласны?

Еще одна классная функция - преобразование изображения в видео. Пример ниже - исходное изображение, созданное с помощью Dall-E.

A Shiba Inu dog wearing a beret and black turtleneck.

Разве не было бы невероятно, если бы Sora была интегрирована в ChatGPT Plus? Вы могли бы описать изображение искусственному интеллекту, сгенерировать его, а затем сразу же превратить в анимацию! Это было бы очень круто.

И еще, мы уже можем получить доступ к Sora? Не терпится увидеть волшебство с изображениями MidJourney.

Что, если бы вы могли взять два совершенно разных видео - скажем, одно с шумной городской улицы, а другое со спокойного леса - и заставить Sora плавно соединить их вместе?

Именно это и делает интерполяция, и результаты получаются просто завораживающими. Потенциал для творческого редактирования видео и художественного выражения огромен.

Еще одна огромная особенность Sora - возможность продлевать видео.

Это дает потрясающую свободу действий для создателей контента и продюсеров фильмов.

Однако возможность так легко манипулировать видео также вызывает серьезные опасения по поводу возможного появления дипфейков и ставит новые вопросы, связанные с авторскими правами.

Прошло уже несколько дней с момента анонса Sora, а она до сих пор на слуху в сети. Команда Sora постоянно выкладывает новые видео на X, и все они поистине умопомрачительны.

Даже в первой версии ее возможности просто поражают воображение. Я могу только представить, на что Sora будет способна через несколько версий. Как обычно говорит доктор Кароли Жолнаи-Фехер:

Если начальная версия Sora уже настолько впечатляет, что даже страшно подумать, как эта технология может полностью изменить будущее создания видео.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

#openai #sora #генерациявидео

Источник статьи на английском - здесь.

42 комментария

Дмитрий Маслов

20 февр

за последние пару дней эта сора везде без вазелина, я уже о ней знаю все что только можно

Ответить

NeuroЭнтузиаст (Алексей)

Автор

))). Значит, openai произвели пусть не революцию, но как минимум фурор ). Или вы так не считаете?

Комментарий удалён модератором

Развиваться всегда есть куда. Главное - шаг или рывок уже сделан ).

а стейбл видео дифьюжен?)) проблема в том что на стадии презентации вкатывают самое успешное, а чтобы достичь такого качество нужно сотни генераций, оно то конечно все впечатляет, но что будет на старте никто не знает.

Полностью согласен. Видел даже видео-сравнение runway и sora - разница видна конкретная.

5 особенностей Sora от OpenAI, о которых вы, вероятно, не знали

1. Sora может изменять стили и обстановку в видеороликах

2. Sora может генерировать изображения

3. Sora может превращать изображения в видео

4. Sora может интерполировать два видео

5. Sora может увеличивать продолжительность существующего видео