Google DeepMind представила Genie 3 — нейросеть для создания интерактивных миров из текста
Подразделение Google, специализирующееся на искусственном интеллекте, анонсировало Genie 3 — прорывную модель, способную генерировать целые виртуальные миры по текстовому описанию. Технология создает трехмерные сцены в разрешении 720p при 24 кадрах в секунду, по которым пользователь может свободно перемещаться в реальном времени.
Ключевое нововведение — полноценная визуальная память. В отличие от предыдущих версий, Genie 3 сохраняет пространственную согласованность: при повороте камеры или возвращении в уже исследованную зону мир остается неизменным, без искажений и артефактов. Длительность одной симуляции выросла до нескольких минут, что является колоссальным скачком по сравнению с секундами в предыдущих моделях.
Более того, модель поддерживает «управляемые события» — возможность с помощью текстовых команд вызывать в сцене определенные действия, например, запустить фейерверк. Хотя полноценное взаимодействие с объектами пока ограничено разработчиками, потенциал технологии выходит далеко за рамки геймдева.
DeepMind позиционирует Genie 3 как «Модель Мира» (World Model) — фундамент для симуляции сложных систем, от природных явлений до тренировок в экстремальных условиях. Подобные модели также считаются важным шагом на пути к созданию сильного искусственного интеллекта (AGI), предоставляя ему «бесконечный полигон» для обучения.
Подписывайся на телеграмм канал, там много интересного