{"id":14284,"url":"\/distributions\/14284\/click?bit=1&hash=82a231c769d1e10ea56c30ae286f090fbb4a445600cfa9e05037db7a74b1dda9","title":"\u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0444\u0438\u043d\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0430 \u0442\u0430\u043d\u0446\u044b \u0441 \u0441\u043e\u0431\u0430\u043a\u0430\u043c\u0438","buttonText":"","imageUuid":""}

5 особенностей Sora от OpenAI, о которых вы, вероятно, не знали

Sora, революционный видеогенератор ИИ от OpenAI, в последнее время набирает огромную популярность в мире ИИ благодаря своей способности создавать высококачественное видео из простых текстовых запросов.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Но возможности Sora простираются далеко за пределы создания видео из текстовых промптов. Вот пять примеров:

  1. Изменение стиля окружающей обстановки в видеороликах
  2. Генерация изображений
  3. Превращение изображений в видео
  4. Интерполяция двух видео
  5. Расширение существующих видеороликов

Давайте подробнее рассмотрим каждую из этих функций.

1. Sora может изменять стили и обстановку в видеороликах

Представьте, что вы берете современное видео и плавно превращаете его в сцену из 1920-х годов, с классическими автомобилями и старинными зданиями.

Посмотрите на этот пример: верхний видеоролик в качестве исходных данных и получившееся видео в нижней части с помощью следующего промпта:

Change the setting to the 1920s with an old school car. make sure to keep the red color

Качество работы Sora можно назвать революционным! Это открывает умопомрачительные возможности. Вот несколько из них:

  • Кинопроизводство. Значительно снижает стоимость за счет трансформации сцен под любую эпоху или стиль.
  • Образование. Визуальное воссоздание исторических событий или периодов позволяет погрузиться в процесс обучения.
  • Реклама. Позволяет создавать уникальный контент, размещая товары в различных обстановках.

2. Sora может генерировать изображения

Sora не ограничивается только созданием видео. Она также может генерировать изображения с разрешением до 2048 x 2048 пикселей.

Она работает путем расположения пятен гауссовского шума в пространственной сетке с временной протяженностью в один кадр.

Вот пример:

Промпт: A snowy mountain village with cozy cabins and a northern lights display, high detail and photorealistic dslr, 50mm f/1.2

Теперь сравните результат Sora с изображением, сгенерированным DALL-E 3 с помощью того же промпта.

На мой взгляд, изображение, созданное Sora, выглядит лучше. Кажется, что он ярче передает магию северного сияния. Вы согласны?

3. Sora может превращать изображения в видео

Еще одна классная функция - преобразование изображения в видео. Пример ниже - исходное изображение, созданное с помощью Dall-E.

A Shiba Inu dog wearing a beret and black turtleneck.

Разве не было бы невероятно, если бы Sora была интегрирована в ChatGPT Plus? Вы могли бы описать изображение искусственному интеллекту, сгенерировать его, а затем сразу же превратить в анимацию! Это было бы очень круто.

И еще, мы уже можем получить доступ к Sora? Не терпится увидеть волшебство с изображениями MidJourney.

4. Sora может интерполировать два видео

Что, если бы вы могли взять два совершенно разных видео - скажем, одно с шумной городской улицы, а другое со спокойного леса - и заставить Sora плавно соединить их вместе?

Именно это и делает интерполяция, и результаты получаются просто завораживающими. Потенциал для творческого редактирования видео и художественного выражения огромен.

5. Sora может увеличивать продолжительность существующего видео

Еще одна огромная особенность Sora - возможность продлевать видео.

Это дает потрясающую свободу действий для создателей контента и продюсеров фильмов.

Однако возможность так легко манипулировать видео также вызывает серьезные опасения по поводу возможного появления дипфейков и ставит новые вопросы, связанные с авторскими правами.

Прошло уже несколько дней с момента анонса Sora, а она до сих пор на слуху в сети. Команда Sora постоянно выкладывает новые видео на X, и все они поистине умопомрачительны.

Даже в первой версии ее возможности просто поражают воображение. Я могу только представить, на что Sora будет способна через несколько версий. Как обычно говорит доктор Кароли Жолнаи-Фехер:

Если начальная версия Sora уже настолько впечатляет, что даже страшно подумать, как эта технология может полностью изменить будущее создания видео.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Источник статьи на английском - здесь.

0
46 комментариев
Написать комментарий...
Дмитрий Маслов

за последние пару дней эта сора везде без вазелина, я уже о ней знаю все что только можно

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

))). Значит, openai произвели пусть не революцию, но как минимум фурор ). Или вы так не считаете?

Ответить
Развернуть ветку
Дмитрий Маслов

посмотрим что они произведут на старте, потому что многие выкатывали и ролики и примеры возможностей а на старте выходило капец...

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Согласен. Главное - чтобы не получилось, как у гугла с bard и gemini ). Вы сравнивали их с чатгпт?

Ответить
Развернуть ветку
Дмитрий Маслов

у что то вроде того, у runway к примеру то же есть впечатляющие видео, в стейбл видео дифьюжет можно добиться интересных результатов, но если оно действительно будет так работать это конечно будет интересно, другое дело за сколько все это будет доступно, я думаю подписка будет стоить не менее нескольких сотен долларов при таком качестве

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Это смотря на что они ставку сделают - на использование максимальным количеством пользователей, или на использование в коммерческих целях. Но, думаю, им будет инетереснее большее количество юзеров, поэтому ценовую планку они задирать не будут.

Ответить
Развернуть ветку
Tom

Мне кажется, здесь пока больше рекламы, чем качества генерации. Да, получше, чем пика или ранвэй, но все равно до реального видео еще развиваться и развиваться.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Развиваться всегда есть куда. Главное - шаг или рывок уже сделан ).

Ответить
Развернуть ветку
Alex Levish

Если генерируемые видео будут такого качества, как в их примерах, то конкурентов у Openai в генерации виео на самом деле нет - даже runway и pika недотягивают до этого уровня.

Ответить
Развернуть ветку
Дмитрий Маслов

а стейбл видео дифьюжен?)) проблема в том что на стадии презентации вкатывают самое успешное, а чтобы достичь такого качество нужно сотни генераций, оно то конечно все впечатляет, но что будет на старте никто не знает.

Ответить
Развернуть ветку
Vasiliy Maksimov

Альтман в Х в прямом эфире принимал запросы пользователей на генерацию и постил, время генерации около часа

Ответить
Развернуть ветку
Дмитрий Маслов

интересно, но то что сейчас выкладывают те которым дали доступ не всегда впечатляет, хотя конечно есть оптимисты которые безропотно верят в успех. Я слышал что даже некоторые киностудии замораживают свои проекты до выхода

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Спасибо за информацию, я про это не знал.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Это да. Далеко за примером ходить не надо - известная корпорация уже лажанулась пару раз.

Ответить
Развернуть ветку
Дмитрий Маслов

в том то и дело, те примеры которые предоставлены они конечно поражают, будем ждать, может действительно что то дельное выйдет, хотя я думаю что все это не к добру, сколько же людей потеряет работу

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Полностью согласен. Видел даже видео-сравнение runway и sora - разница видна конкретная.

Ответить
Развернуть ветку
Ольга

Видео с собакой, конечно, выглядит как реальное - мимика собаки очень хорошо сгенерирована.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Да, по сравнению с runway качество видео на голову выше.

Ответить
Развернуть ветку
Вадим Войнов

А где Сору можно попробовать, из статьи непонятно.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Пока нигде, опенаи ссылку пока не выкладывало на доступ к нейронке.

Ответить
Развернуть ветку
Тофсла и Вифсла

А, я узнал эту собачку, это же она говорит: "Имя Ибрагим, вам о чем-нибудь говорит?"

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Где говорит?

Ответить
Развернуть ветку
Тофсла и Вифсла

Ну что вы, это база, стыдно не знать!

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

))) Не встречал раньше такого мема.

Ответить
Развернуть ветку
павел борисов

На мой взгляд, это очень крутые видео, если учесть, что они сгенерированы нейронкой.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Я тоже так считаю.

Ответить
Развернуть ветку
Алексей Макаров

Интересно, а можно ли будет использовать сгенерированные видео в коммерческих целях?

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Пока, насколько я знаю, информации об этом нету.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Neuromarket (Алексей)
Автор

Пока это только релиз, посмотрим, что будет дальше ).

Ответить
Развернуть ветку
Vladimir Kolenechkо

Миджорни лучше, конечно, генерирует изображения. Но зато связка МЖ+Сора будет +++

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Согласен. При адекватных ценах многие сменят pika или runway на sora.

Ответить
Развернуть ветку
Ольга Араз

Может, я не понимаю замысла маркетологов, но зачем столько шума, если инструмент еще не доступен?

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Видимо, это специфика продвижения товаров и сервисов в США. А шума много из-за того, что похожего по уровню еще пока не было.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Я создал не шум, а опубликовал обзор. Без рефок, обрати внимание.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Альтман в прямом эфире генерировал видео по промптам, которые присылали его подписчики).

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Я шумлю обо всем, о чем хочу, если это не запрещено ).

Ответить
Развернуть ветку
Роман Величкин

Пока не ясна себестоимость этого процесса в пересчёте на генерацию одной секунды видео.

А учитывая опыт других решений по генерации изображений, когда для получения нужного результата нужно выполнить десятки, а то и сотни генераций - и это на один кадр, то сколько их потребуется для генерации видео?

Доподлинно известно, что себестоимость одного запроса в chatgpt-4 в несколько раз выше чем в chatgpt-3.5.

Поэтому Sora может оказаться игрушкой для богатых, финансово недоступной большинству людей.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Вполне может быть. Либо только для коммерческого использования.

Ответить
Развернуть ветку
Роман Величкин
революционный видеогенератор ИИ от OpenAI, в последнее время набирает огромную популярность в мире ИИ благодаря своей способности создавать высококачественное видео из простых текстовых запросов.

Как Sora может набирать популярность в мире ИИ, если инструмент даже не находится в закрытом бета-тесте, доступ до него есть у избранных единиц?

"Взбудоражил СМИ", "У всех на слуху" - вот более честные формулировки.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Её ещё не представили, а она уже популярна. Так бывает).

Ответить
Развернуть ветку
Роман Величкин
На мой взгляд, изображение, созданное Sora, выглядит лучше. Кажется, что он ярче передает магию северного сияния. Вы согласны?

По одному запросу нечестно оценивать.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Зачастую достаточно одного промпта.

Ответить
Развернуть ветку
Роман Величкин

Отличная аргументация!

Вот вам мой ответ: зачастую недостаточно одного промпта.

Ответить
Развернуть ветку
43 комментария
Раскрывать всегда