Генератор 3D-моделей от Nvidia, редактирование фото в FLUX и новые чат-боты: дайджест ИИ-обновлений за неделю

Коротко о том, что изменилось в сервисах для создания видео, фото, 3D-моделей и музыки.

Фото

В генератор изображений FLUX добавили набор новых инструментов FLUX.1 Tools для редактирования созданных фотографий. Доступны через API в версии FLUX.1 Рro (генерация одного изображения стоит около 6 рублей по курсу ЦБ на 22 ноября 2024 года), а также в деморежиме на Hugging Face и GitHub.

Инструмент заливка, позволяющий сгенерировать новый объект или фон в выделенной области. Здесь и далее источник: BlackForestLabs
Инструмент заливка, позволяющий сгенерировать новый объект или фон в выделенной области. Здесь и далее источник: BlackForestLabs
Инструмент Canny для изменения изображения по контуру фигуры
Инструмент Canny для изменения изображения по контуру фигуры
Инструмент Depth для редактирования с учётом глубины без изменения композиции
Инструмент Depth для редактирования с учётом глубины без изменения композиции
Инструмент Redux для создания новых версий и стилей с сохранением элементов оригинала
Инструмент Redux для создания новых версий и стилей с сохранением элементов оригинала

Дизайн

В сервис для дизайнеров Recraft добавили новые стили для 2D-рисунков, векторной графики и фотореалистичных генераций.

Например, Antiquarian в стиле винтажных гравюр и Crosshatch с особой штриховкой. В сервисе доступно 50 бесплатных кредитов для создания дизайнов в день — этого хватит на 50 генераций.

Видео

Продолжительность генерируемых роликов в нейросети Runway Gen-3 увеличилась с 10 до 20 секунд в режиме преобразования видео в видео. Доступно в модели Gen-3 Alpha Turbo. При регистрации в Runway дают 125 бесплатных кредитов. Генерация одного видео длиннее пяти секунд стоит 50 кредитов.

Источник: Jon Finger

В сервисе для создания виртуальных аватаров Hedra улучшили голоса — теперь можно выбирать язык, настраивать акценты, менять голос и удалять фоновый шум. Однако пользователи отмечают, что качество самих аватаров осталось таким же, как в бета версии.

Источник: Hedra

Разработчик библиотеки для дизайнеров Freepik запустил генератор видео с моделями Runway, Kling AI, Luma Labs Dream Machine, Minimax и Mochi V1. Доступен владельцам платных подписок стоимостью от €60 в год (чуть больше 6000 рублей по курсу ЦБ на 22 ноября 2024 года).

Источник: Freepik

3D-моделирование

Разработчики из лаборатории Nvidia создали сервис LLaMA-Mesh для генерации 3D-мешей (полигональных сеток, основ для 3D-моделей) по текстовым подсказкам. Бесплатная демоверсия доступна на Hugging Face.

На видео ИИ создаёт основу 3D-модели скамейки по текстовому запросу: «Я оформляю сад и хочу добавить места, где можно присесть. Какие скамейки самые распространённые?». Источник: Nvidia

Чат-боты

Китайская компания представила ИИ-модель DeepSeek-R1-Lite с возможностью рассуждений. По умолчанию на русскоязычные запросы чат-бот отвечает на английском, но может перевести итоговый ответ на русский, если дать такую команду. В день доступно 50 бесплатных запросов.

В бесплатный чат-бот Le Chat добавили поиск по интернету, генератор изображений на базе Flux Pro и режим редактирования контента в отдельном окне Canvas. Также появилась возможность загрузить и проанализировать PDF.

Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Ftestingcatalog%2Fstatus%2F1858566561306493232%3Fs%3D46&postId=1667584" rel="nofollow noreferrer noopener" target="_blank">Testingcatalog</a>
Источник: Testingcatalog

В ChatGPT 4o улучшили «творческие способности» для написания текстов. Модель также научили лучше анализировать загруженные файлы.

Источник: OpenAI
Источник: OpenAI

Музыка

Разработчики Suno AI выпустили новую модель для создания музыки v4 с «улучшенным звучанием». С функцией Remaster можно повысить качество старых генераций. Добавили «более креативную» модель ReMi для написания текстов песен. Доступно в бета-версии по подпискам Pro и Premier за $10 и $30 в месяц (1000 и 3000 рублей по курсу ЦБ на 20 ноября 2024).

Трек, созданный с помощью v4. Источник: Suno
22
22
11
1 комментарий

Генерация три де очень интересная штука, хотя если посмотреть как сейчас при помощи нейросетей преобразуют старые игры в фотореалистичную графику... я думаю, что игры в будущем превратятся в набор референсов которые нейросеть будет преобразовывать в какое то видео, в дальнейшем все обойдется вообще без референсов а просто правильным промтом и сам геймдев постепенно уйдет в прошлое.

1
Ответить