Sora 2: новый шаг в генерации видео и аудио

OpenAI представила Sora 2 — флагманскую модель генерации видео и звука, которая обещает задать новый стандарт реалистичности и управляемости.

От Sora 1 к Sora 2

Первая версия Sora, вышедшая в феврале 2024 года, стала переломным моментом для индустрии. Впервые генерация видео начала работать достаточно стабильно: объекты сохраняли перманентность, сцены выглядели убедительнее. Это был «момент GPT-1 для видео».

Sora 2 — скачок на порядок выше. Теперь модель можно сравнить с «моментом GPT-3.5» в мире видео. Она справляется с задачами, которые раньше казались невозможными: сложные спортивные трюки, гимнастические сальто или точная симуляция физики воды и объектов.

Если в предыдущих версиях модели могли «подтасовывать реальность» ради результата (например, мяч телепортировался в кольцо), то Sora 2 лучше следует законам физики. Ошибки, которые она допускает, часто выглядят как ошибки персонажей внутри сцены, а не как сбои генератора.

Управляемость и стили

Sora 2 научилась:

  • следовать сложным инструкциям, охватывающим несколько кадров,
  • сохранять целостность состояния мира,
  • работать в реалистичном, кинематографичном и аниме-стиле.

Модель теперь генерирует не только видео, но и звук: речь, эффекты, фоновое аудио. Более того, можно встроить в сцену реального человека — с сохранением внешности и голоса.

Новое приложение Sora

Одновременно с моделью компания запускает iOS-приложение Sora. В нём пользователи смогут:

  • создавать и ремикшировать видео,
  • находить контент в персональной ленте,
  • добавлять себя или друзей с помощью функции Cameo.

Для создания камео достаточно один раз записать короткое видео и аудио. После этого можно «перемещаться» в любые сцены, созданные с помощью Sora.

OpenAI позиционирует приложение как социальную сеть нового типа, где ключевой акцент сделан на совместное творчество, а не на бесконечное потребление контента.

Ответственный запуск

Компания признаёт риски: зависимости, изоляция, токсичность. Чтобы их снизить, внедрены:

  • алгоритмы рекомендаций, управляемые на естественном языке,
  • встроенные опросы для контроля самочувствия,
  • родительский контроль через ChatGPT,
  • ограничение на количество видео в ленте для подростков,
  • расширенный штат модераторов.

OpenAI подчёркивает: цель — стимулировать креативность, а не увеличивать время в приложении.

Что дальше

Приложение Sora доступно в США и Канаде по приглашениям, расширение географии запланировано в ближайшее время.

  • Sora 2 доступна бесплатно с начальными лимитами.
  • Пользователи ChatGPT Pro смогут тестировать версию Sora 2 Pro.
  • В будущем планируется интеграция модели в API.

Почему это важно

Видеомодели стремительно прогрессируют. Возможность симулировать реальность и управлять ею открывает путь к новым форматам развлечений, образования и даже робототехники.

Sora 2 — не идеальна, но уже демонстрирует, что генерация видео переходит на новый уровень. Если первая версия была proof-of-concept, то Sora 2 становится полноценным инструментом.

1
Начать дискуссию