Google открывает доступ к AI-генератору миров Project Genie для подписчиков.

Google открывает доступ к AI-генератору миров Project Genie для подписчиков.

Как работает инструмент

Пользователи начинают с создания текстовых запросов для окружения и главного персонажа, которые Nano Banana Pro преобразует в изображение.

Это изображение служит основой для интерактивного мира, который Genie 3 генерирует в реальном времени по мере того, как пользователи перемещаются по нему.

Каждый сгенерированный мир можно исследовать в течение 60 секунд с разрешением около 720p и частотой кадров примерно 24 кадра в секунду.

DeepMind объяснили, что временное ограничение существует из-за вычислительных ограничений — каждая пользовательская сессия требует выделения отдельного чипа.

«По сути, когда вы используете инструмент, где-то есть чип, который принадлежит только вам и выделен для вашей сессии», — сказал TechCrunch Шломи Фрухтер, директор по исследованиям в DeepMind.

В практических тестах инструмент отлично справился с созданием причудливых художественных окружений — TechCrunch описал создание замка из зефира с шоколадным рвом в стиле пластилиновой анимации — но испытывал трудности с фотореалистичными или кинематографическими мирами, часто создавая результаты, которые выглядели скорее как видеоигры, а не реальные локации.

The Verge обнаружил, что задержка ввода делала окружения «практически неиграбельными», а инструмент иногда не мог поддерживать визуальную согласованность.

Начать дискуссию