Project Genie от Google DeepMind — “бесконечные” интерактивные миры из текста и картинок

Google начал раскатку Project Genie — экспериментального прототипа, где ты задаёшь промпт/картинку, а дальше в реальном времени гуляешь по миру, который ИИ “дорисовывает” прямо по ходу движения.

Что умеет (по сути 3 режима): World sketching — набросал идею мира текстом/референсами, выбрал вид от 1-го или 3-го лица и как перемещаться (пешком/ехать/летать).

World exploration — самая магия: мир генерится во время движения, как бесконечная локация.

World remixing — можно ремиксить чужие миры, брать идеи из галереи/рандомайзера и сохранять результат в видео. Зачем это важно: для контента: быстрые синематик-прогулки, бэкграунды, сцены, превизы для игр: прототипирование уровней за минуты для R&D: шаг к “моделям мира”, где ИИ учится понимать среду и причинно-следственные связи Но это всё ещё эксперимент: реализм и “физика” могут плавать управление персонажем бывает капризным сессии ограничены по времени.

Начать дискуссию