Зачем Google снова "кормит" Уилла Смита спагетти — и что это говорит о будущем AI
AI-соусы, баги, спагетти и двойники Уилла Смита — не реклама нового сериала, а тест-драйв моделей Google. Почему он важен и чем пахнет новый Gemini 1.5?
В 2023 году интернет лопался от кринж-мемов с Уиллом Смитом, который пытается съесть тарелку спагетти. Сгенерированное ИИ-видео было странным, нечеловеческим и почему-то завораживающим. С тех пор "Смит и спагетти" стали мемом и своеобразным бенчмарком для тестов генеративных моделей.
Теперь — дубль два. Google показал новое видео, где всё та же сцена с Уиллом, всё та же паста, но на этот раз — хрустит. Да, буквально: искусственные макароны теперь звучат как сухари. Это смешно. Это абсурдно. И это важно.
Почему Google снова кормит актёра макаронами?
Потому что мемы — отличный способ проверить, как ИИ справляется с контекстом, движением, текстурами и даже культурными аллюзиями. Сцена с Уиллом — не просто случайный тест. Это вызов. Модель должна понять, как выглядят спагетти, как они двигаются, как их ест человек и как это всё должно сочетаться в кадре.
Gemini 1.5 Pro (модель, сгенерировавшая новое видео) справляется лучше предшественников. Его "Смит" более узнаваем, движения правдоподобнее, лицо не плывёт, а паста хотя бы пытается вести себя как еда. Хотя и хрустит. Пока что.
Зачем это нам?
Это не про еду. Это про мультимодальность — способность модели обрабатывать текст, видео, звук и изображение одновременно. И с этим у Google пока всё лучше, чем было у конкурентов. Тесты на подобных задачах — показатель того, насколько далеко продвинулись генеративные алгоритмы и где ещё они спотыкаются.
Уже сегодня такие модели можно использовать для:
- генерации обучающих видео по текстовому сценарию;
- быстрого прототипирования сцен в кино и геймдизайне;
- симуляции действий в цифровых двойниках.
Мем как метрика
То, что Google осознанно использует кринж-мем из прошлого как показатель прогресса, — ход гениальный. Это не только вызывает реакцию аудитории, но и позволяет "пощупать" качество модели даже неспециалисту. В прошлой версии ИИ просто мазал пикселями. В новой — пытается строить причинно-следственные связи (как паста попадает в рот? как открывается челюсть? где лицо у человека?).
И всё же: зачем он хрустит?
Хруст — это артефакт. Ошибка синтеза аудио, когда модель путает текстуры звука. Но даже такие баги — показатель роста. Потому что если ИИ умеет ошибаться по-новому, значит он учится.
Итог
Когда Google показывает Уилла Смита, едущего хрустящие макароны, это не маркетинг, а научная демонстрация. Странная, комичная, но очень показательная. И если вы смеётесь — всё правильно. Смех — это тоже способ понять, как работает интеллект. Даже если он — искусственный.