Sora 2: новый шаг в генерации видео и аудио
OpenAI представила Sora 2 — флагманскую модель генерации видео и звука, которая обещает задать новый стандарт реалистичности и управляемости.
От Sora 1 к Sora 2
Первая версия Sora, вышедшая в феврале 2024 года, стала переломным моментом для индустрии. Впервые генерация видео начала работать достаточно стабильно: объекты сохраняли перманентность, сцены выглядели убедительнее. Это был «момент GPT-1 для видео».
Sora 2 — скачок на порядок выше. Теперь модель можно сравнить с «моментом GPT-3.5» в мире видео. Она справляется с задачами, которые раньше казались невозможными: сложные спортивные трюки, гимнастические сальто или точная симуляция физики воды и объектов.
Если в предыдущих версиях модели могли «подтасовывать реальность» ради результата (например, мяч телепортировался в кольцо), то Sora 2 лучше следует законам физики. Ошибки, которые она допускает, часто выглядят как ошибки персонажей внутри сцены, а не как сбои генератора.
Управляемость и стили
Sora 2 научилась:
- следовать сложным инструкциям, охватывающим несколько кадров,
- сохранять целостность состояния мира,
- работать в реалистичном, кинематографичном и аниме-стиле.
Модель теперь генерирует не только видео, но и звук: речь, эффекты, фоновое аудио. Более того, можно встроить в сцену реального человека — с сохранением внешности и голоса.
Новое приложение Sora
Одновременно с моделью компания запускает iOS-приложение Sora. В нём пользователи смогут:
- создавать и ремикшировать видео,
- находить контент в персональной ленте,
- добавлять себя или друзей с помощью функции Cameo.
Для создания камео достаточно один раз записать короткое видео и аудио. После этого можно «перемещаться» в любые сцены, созданные с помощью Sora.
OpenAI позиционирует приложение как социальную сеть нового типа, где ключевой акцент сделан на совместное творчество, а не на бесконечное потребление контента.
Ответственный запуск
Компания признаёт риски: зависимости, изоляция, токсичность. Чтобы их снизить, внедрены:
- алгоритмы рекомендаций, управляемые на естественном языке,
- встроенные опросы для контроля самочувствия,
- родительский контроль через ChatGPT,
- ограничение на количество видео в ленте для подростков,
- расширенный штат модераторов.
OpenAI подчёркивает: цель — стимулировать креативность, а не увеличивать время в приложении.
Что дальше
Приложение Sora доступно в США и Канаде по приглашениям, расширение географии запланировано в ближайшее время.
- Sora 2 доступна бесплатно с начальными лимитами.
- Пользователи ChatGPT Pro смогут тестировать версию Sora 2 Pro.
- В будущем планируется интеграция модели в API.
Почему это важно
Видеомодели стремительно прогрессируют. Возможность симулировать реальность и управлять ею открывает путь к новым форматам развлечений, образования и даже робототехники.
Sora 2 — не идеальна, но уже демонстрирует, что генерация видео переходит на новый уровень. Если первая версия была proof-of-concept, то Sora 2 становится полноценным инструментом.