Tencent представила модель, способную генерировать «трёхмерные миры» из одного изображения

Согласитесь, ведь здорово было бы погулять по картинам? «Звёздная ночь» Ван Гога, «Постоянство памяти» Дали, «Ночной дозор» Рембрандта, рассмотреть обратную сторону «Чёрного квадрата» Казимира нашего Малевича 🙂. Теперь это возможно!

Tencent представила модель, способную генерировать «трёхмерные миры» из одного изображения

Tencent открыла исходный код модели HunyuanWorld-Voyager, которая может превращать всего одно изображение в целые виртуальные «трёхмерные миры».

Этот алгоритм не строит полноценные 3D-модели наподобие полноценных игровых, но имитирует движение камеры так, что сцена выглядит пространственно согласованной и доступной для «исследования». То есть модель не искажает пропорции, расстояния и согласованность объектов виртуального мира, сохраняя перспективу.

Для управления виртуальными сценами реализован интерфейс задания траектории камеры — вперёд, назад, в стороны или движение с поворотом. Пользователь получает готовое видео и карту глубины, которые можно использовать для реконструкции облаков точек и последующего 3D-моделирования.

💬 То есть можно взять известное изображение или сгенерировать какую-либо картинку с небывалым миром и «побродить» по нему, а потом ещё и загрузить в 3D-редактор и дальше, снова с помощью ИИ, создать игру или просто бродилку по этому миру.

Подписывайтесь на Telegram Нейрочеловек.

6
5
4 комментария