Sora 2: как пользоваться генератором видео от OpenAI

Нейросеть делает ролики со звуком, учитывает законы физики и понимает русский язык.

Сгенерировано в Sora 2

В конце сентября 2025 года OpenAI выпустила генератор видео Sora 2. По заявлению разработчиков, модель лучше предшественницы понимает законы физики и создаёт сложные движения без искажения фона. Например, может показать фигуристку, которая прыгает тройной аксель с кошкой на голове.
Проверили, так ли это на самом деле. Результаты — в тексте.

Как начать пользоваться

На октябрь 2025 года Sora 2 работает только у пользователей с IP-адресами Канады и США. Для доступа к генератору нужен шестизначный код-приглашение. О том, как его получить и какие лимиты есть — в заметке.

Главная страница похожа на первую версию генератора, но пока у Sora 2 меньше настроек: нельзя выбрать соотношение сторон, разрешение, длину ролика. Можно настроить только ориентацию видео.

Источник: sora.com
Источник: sora.com

Под строкой для ввода промпта есть кнопка для загрузки референсов. По правилам сервиса запрещено использовать файлы с изображением насилия, фотографии несовершеннолетних без их согласия. Также нельзя загружать кадры, защищённые авторским правом.

Сложная сцена с движением

Чтобы показать, как хорошо Sora 2 понимает законы физики, OpenAI опубликовала видео, на котором фигуристка делает сложный прыжок с котом на голове. Продолжим тему зимних видов спорта, попробуем сгенерировать столкновение двух хоккеистов.

Промпт: «A realistic ice hockey scene. Two professional hockey players, both wearing full black uniforms with helmets and pads, skate at high speed and collide hard with each other near the transparent rink boards. The camera is positioned right outside the glass boards, as if filmed by a spectator with a handheld camera, creating a natural human-perspective shot. The background shows the ice rink and blurred crowd behind the glass. Dynamic movement, impact, and realistic motion. Natural lighting, sports broadcast feel».

(«Реалистичная сцена, хоккейный матч. Два профессиональных хоккеиста, оба в чёрной форме с шлемами и защитными накладками, катаются на коньках на высокой скорости и сильно сталкиваются друг с другом возле прозрачных бортов катка. Камера расположена прямо за стеклянными бортами, как будто видео снимает зритель. На заднем плане виден каток и размытая толпа за стеклом. Динамичное движение, реалистичные движения. Естественное освещение, ощущение спортивной трансляции»).

Видео не полностью соответствует промпту: хоккеисты не столкнулись у бортика, один игрок врезался сначала в ворота, а потом в ограждение. Из плюсов: физику генератор действительно учитывает, после столкновения ворота реалистично шатаются.

Тизер мультфильма

Sora 2 генерирует видео сразу с озвучкой. Попросим сгенерировать аудиоряд для тизера мультфильма.

Промпт: «A teaser for an animated film in the style of 1960s Disney, blended with dark academia aesthetics. Animation look with soft grain and slightly faded vintage colors. The scene shows a gothic university campus at dusk: tall stone buildings with ivy, and students in cloaks walking through archways. The camera moves slowly, cinematic and moody, with dramatic shadows and warm golden light against deep blues and browns. A sense of mystery, scholarly romance, and subtle tension. Horizontal video, teaser style, atmospheric soundtrack mood».

(«Тизер анимационного фильма в стиле Disney 1960-х годов, эстетика мрачной академии. Анимация с мягкой зернистостью и слегка бледными винтажными цветами. Сцена показывает готический университетский кампус в сумерках: высокие каменные здания с плющом, студенты в плащах, проходящие через арки. Камера движется медленно, кинематографично. Драматичные тени, тёплый золотистый свет на фоне глубоких синих и коричневых тонов. Ощущение тайны, школьной любви и лёгкого напряжения. Горизонтальное видео, стиль тизера, атмосферный саундтрек»).

Текст и музыка попали в цель: они соответствуют заданному настроению, голос диктора звучит естественно. Вопросы к самой анимации: она не передаёт стиль 1960-х, лица студенток в начале смазаны. И тизер не ощущается законченным.

Герои, которые говорят на русском без акцента

Проверим, как Sora 2 справится с текстом на русском языке.

Промпт: «A vertical realistic TikTok video. A young female influencer, casual clothing, smiling naturally at the camera, speaking directly to the viewer. She says in Russian: “Подпишитесь на мой канал, пожалуйста. Мне нечем платить за квартиру”. Warm, friendly, approachable vibe, natural gestures, casual room background with soft lighting. Realistic facial expressions, human-like movement, selfie-camera perspective, vertical format».

(«Вертикальное реалистичное TikTok-видео. Молодая девушка-инфлюенсер в повседневной одежде, естественно улыбается в камеру и обращается к зрителю. Она говорит по-русски: “Подпишитесь на мой канал, пожалуйста. Мне нечем платить за квартиру”. Тёплая, дружеская атмосфера, естественные жесты, фон комнаты с мягким освещением. Реалистичное выражения лица, естественные движения, перспектива селфи-камеры, вертикальный формат»).

Девушка говорит без акцента, видео соответствует промпту. Есть несвойственные для русского языка перепады интонаций, реплика звучит как вопрос.

Реклама стирального порошка

Теперь попросим Sora 2 сгенерировать полноценную рекламу, а не отдельную сцену. И тоже на русском языке.

Промпт: «A realistic Russian commercial video. The main character is a cheerful multi-child father in his 30s. Quick sequence: kids spill juice and make a mess, he confidently pours "Чистюля" laundry detergent into the washing machine, smiles at the camera. Bright, warm home lighting, natural human expressions, relatable and friendly vibe. At the end, he says directly to the camera the slogan in Russian: “Чистюля — для настоящего хозяина”. Clear, cinematic shots, concise storytelling».

(«Реалистичный российский рекламный ролик. Главный герой — весёлый отец нескольких детей, ему 30 лет. Быстрая смена кадров: дети проливают сок и устраивают беспорядок, папа уверенно наливает стиральный порошок “Чистюля” в стиральную машину, улыбается в камеру. Яркое, тёплое домашнее освещение, естественные выражения лиц, дружеская атмосфера. В конце герой обращается прямо к камере и произносит слоган на русском языке: “Чистюля — для настоящего хозяина”. Четкие кинематографические кадры, лаконичное повествование».

Основную идею передать удалось, но не обошлось без галлюцинаций. Больше всего проблем с руками: местами у героя по шесть пальцев на ладони, средство мужчина выливает прямо на пол. При этом ролик действительно похож на рекламу, общий сюжет считывается, фразу в конце герой произносит без ошибок.

YouTube-челлендж

Попробуем дать Sora меньше контекста: опишем ситуацию в общих чертах, без деталей.

Промпт: «YouTube video: a streamer eats a spoonful of cinnamon and immediately starts sneezing».

(«Видео на YouTube: стример ест ложку корицы и сразу же начинает чихать»).

Главный минус: герой продолжает говорить с полным ртом корицы, начинает чихать на сразу. В остальном ролик вышел довольно правдоподобным, в этом помогли детали: смех за кадром, фон, мужчина, который снимает стримера на телефон.

Сцена из мультика

Попробуем дать генератору референс, а промпт максимально сократим.

Промпт: «Characters from the cartoon are fighting».
(«Персонажи из мультика дерутся»).

Изображение-референс. Кадр из мультсериала «Аватар: Легенда об Аанге», реж.  Майкл Данте Димартино   
Изображение-референс. Кадр из мультсериала «Аватар: Легенда об Аанге», реж. Майкл Данте Димартино   

С задачей нейросеть справилась. Единственная галлюцинация — это третья рука Зуко (персонаж с хвостом) в самом конце видео. Примечательно, что в промпте не было указания на конкретный мультсериал. При этом герои сражаются в том же стиле, что и в реальном мультфильме. Зуко называет Аватара Аватаром, сгенерированные голоса похожи на голоса актёров озвучки.

Коротко

  • Пока генератор доступен только пользователям с IP-адресами Канады и США. Для доступа к генератору нужен шестизначный код-приглашение.
  • Sora 2 действительно учитывает законы физики и не искажает фон. При этом сложные сцены пока генерирует неидеально (как в случае с хоккеистами).
  • Нейросеть справляется с задачами и без подробного промпта: озвучка тизера, реплики героев «Аватар: Легенда об Аанге» и закадровые голоса звучали реалистично во всех генерациях.
  • Русский язык на видео звучит без акцента, но интонации всё же иногда путаются.
4
2
1
1
1 комментарий