Зачем Google снова "кормит" Уилла Смита спагетти — и что это говорит о будущем AI

Зачем Google снова "кормит" Уилла Смита спагетти — и что это говорит о будущем AI

AI-соусы, баги, спагетти и двойники Уилла Смита — не реклама нового сериала, а тест-драйв моделей Google. Почему он важен и чем пахнет новый Gemini 1.5?

В 2023 году интернет лопался от кринж-мемов с Уиллом Смитом, который пытается съесть тарелку спагетти. Сгенерированное ИИ-видео было странным, нечеловеческим и почему-то завораживающим. С тех пор "Смит и спагетти" стали мемом и своеобразным бенчмарком для тестов генеративных моделей.

Теперь — дубль два. Google показал новое видео, где всё та же сцена с Уиллом, всё та же паста, но на этот раз — хрустит. Да, буквально: искусственные макароны теперь звучат как сухари. Это смешно. Это абсурдно. И это важно.

Почему Google снова кормит актёра макаронами?

Потому что мемы — отличный способ проверить, как ИИ справляется с контекстом, движением, текстурами и даже культурными аллюзиями. Сцена с Уиллом — не просто случайный тест. Это вызов. Модель должна понять, как выглядят спагетти, как они двигаются, как их ест человек и как это всё должно сочетаться в кадре.

Gemini 1.5 Pro (модель, сгенерировавшая новое видео) справляется лучше предшественников. Его "Смит" более узнаваем, движения правдоподобнее, лицо не плывёт, а паста хотя бы пытается вести себя как еда. Хотя и хрустит. Пока что.

Зачем это нам?

Это не про еду. Это про мультимодальность — способность модели обрабатывать текст, видео, звук и изображение одновременно. И с этим у Google пока всё лучше, чем было у конкурентов. Тесты на подобных задачах — показатель того, насколько далеко продвинулись генеративные алгоритмы и где ещё они спотыкаются.

Уже сегодня такие модели можно использовать для:

  • генерации обучающих видео по текстовому сценарию;
  • быстрого прототипирования сцен в кино и геймдизайне;
  • симуляции действий в цифровых двойниках.

Мем как метрика

То, что Google осознанно использует кринж-мем из прошлого как показатель прогресса, — ход гениальный. Это не только вызывает реакцию аудитории, но и позволяет "пощупать" качество модели даже неспециалисту. В прошлой версии ИИ просто мазал пикселями. В новой — пытается строить причинно-следственные связи (как паста попадает в рот? как открывается челюсть? где лицо у человека?).

И всё же: зачем он хрустит?

Хруст — это артефакт. Ошибка синтеза аудио, когда модель путает текстуры звука. Но даже такие баги — показатель роста. Потому что если ИИ умеет ошибаться по-новому, значит он учится.

Итог

Когда Google показывает Уилла Смита, едущего хрустящие макароны, это не маркетинг, а научная демонстрация. Странная, комичная, но очень показательная. И если вы смеётесь — всё правильно. Смех — это тоже способ понять, как работает интеллект. Даже если он — искусственный.

1
Начать дискуссию