Этот ИИ-инструмент может генерировать 3D-модели за 5 секунд
Однако одним из недостатков Genie является то, что процесс генерации может занимать около 10 минут.
Теперь новое решение под названием LGM обещает значительно сократить это время, создавая 3D-модели всего за 5 секунд. Насколько это правда? Давайте узнаем.
Еще больше полезностей - в моем телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.
Что такое LGM?
LGM (Large Multi-View Gaussian Model) представляет собой новую систему, которая позволяет создавать 3D-модели высокого разрешения из простых текстовых описаний или даже отдельных изображений.
В нем используется асимметричная магистраль U-Net, а также многоракурсные диффузионные модели. Эта технологическая комбинация позволяет практически мгновенно создавать 3D-изображения, устраняя проблемы с разрешением и точностью, характерные для более ранних моделей.
Если вы хотите узнать больше о том, как работает LGM, ознакомьтесь с этим техническим документом.
Бесплатное демо (попробуйте сами)
Перейдите на страницу LGM HuggingFace и начните вводить описание 3D-объекта, который вы хотите сгенерировать. Например, я хочу сгенерировать 3D-модель плюшевого медведя.
Промпт: teddy bear
Вот предварительный просмотр сгенерированной 3D-модели:
Эта 3D-модель выглядит просто фантастически! Все углы кажутся правильными, и, несмотря на то, что на модель можно смотреть под разными углами, она остается целостной - никаких странных искажений.
Теперь давайте попробуем создать более сложную модель и посмотрим, насколько хорошо ИИ сможет ее сгенерировать.
Промпт: Ducati Hypermotard 939
К сожалению, если отдельные предварительные изображения выглядели многообещающе, то полноценная 3D-модель оказалась не столь удачной.
Преобразование изображения в 3D
Помимо функции преобразования текста в 3D, LGM также поддерживает создание 3D-объектов из исходного изображения.
Созданная 3D-модель отлично сохранила свою форму и структуру, что еще раз свидетельствует о понимании формы ИИ.
Вот еще примеры со страницы проекта LGM:
Почему это важно?
- Плюсы: Этот тип технологии является потенциально революционным для 3D-моделирования. Художники получат быстрый способ мозгового штурма и создания объектов. Разработчики игр смогут оптимизировать рабочие процессы, ускоряя создание прототипов и производство.
- Минусы: Как и у любого технологического скачка, есть и минусы. Некоторые 3D-художники могут не захотеть использовать эти инструменты и отстать от прогресса. Маркетплейсы, продающие стоковые 3D-объекты, могут серьезно пострадать. Даже такие крупные компании, как Adobe и Autodesk, гиганты в области программного обеспечения для 3D-моделирования, могут столкнуться с проблемами, поскольку ИИ делает рабочие процессы более простыми и доступными.
Что дальше?
Представьте себе, как это решение на базе ИИ может изменить несколько отраслей промышленности.
- Игры: Более динамичные и детализированные игровые миры, созданные быстрее, чем когда-либо.
- Анимация: Персонажи и окружение оживают с беспрецедентной скоростью и легкостью.
- 3D-печать: Проектирование физических объектов и быстрое создание прототипов может стать доступным для гораздо большего числа людей.
- Архитектура: Более сложные проекты, визуализация и доработка которых происходит в мгновение ока.
Постоянная конкуренция
Если вы думаете, что это новая технология, то это не так. Существует несколько генераторов 3D-моделей на базе ИИ. Среди них несколько, о которых я уже рассказывал:
LumaLabs
DreamFusion 3D
- Stable Zero123
Эта конкуренция - замечательная вещь! Она стимулирует развитие инноваций и побуждает разработчиков делать свои инструменты еще лучше, быстрее и доступнее.
В целом я рад видеть еще один ИИ-инструмент, который может генерировать 3D-объекты, не имея ничего, кроме текстового описания или изображения. Я впервые вижу решение, которое может принимать исходное изображение и генерировать на выходе целостную 3D-модель достойного качества.
Несмотря на то что важно помнить о потенциальных проблемах, с которыми сталкивается эта технология, ее творческий потенциал неоспорим. LGM - это настоящий скачок вперед, и мне не терпится увидеть, как разработчики и исследователи смогут усовершенствовать свое решение, чтобы на выходе получить загружаемую 3D-модель, подобную решению Luma Lab.
Еще больше полезностей - в моем телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.
Источник статьи на английском - здесь.
Комментарий удалён модератором
Вся модель битая, ее в деле невозможно использовать (только как по играться). Надо все переделывать.
Согласен с вами. И мне тоже было бы интересно узнать мнение спецов, которые работают с моделированием - фигня это все, или нормальный инфтрумент.
предварительные изображения выглядели многообещающе, то полноценная 3D-модель оказалась не столь удачной.Короче 3D генерация пока что полная хрень.
Баловаться можно, в работу, в продакшен пока нет.
Согласен, но уже хоть побаловаться можно, и не надо часами ждать рендеринга ). Разве это уже не прогресс?
Комментарий удалён модератором
Я тоже считаю, что как минимум протестировать стоит.