Фотореалистичные аватары в HeyGen, релиз языковой модели Claude 3.5 Haiku и не только: дайджест ИИ-обновлений за неделю

Коротко о том, что изменилось в сервисах для генерации видео, фото, текстов и музыки.

Видео

В нейросеть для генерации видео Gen-3 Alpha Turbo от Runway добавили расширенное управление камерой в генерируемых сценах. Есть шесть параметров: перемещение камеры по горизонтали и вертикали, панорама вокруг объекта, наклон, зум, а также вращение по часовой стрелке и против неё.

Опции можно найти в настройках — в разделе Camera Control. Доступно для подписчиков всех тарифов Gen-3 — в том числе бесплатного.

Управление камерой в Gen-3 Alpha Turbo. Источник: Runway

HeyGen представила функцию создания фотореалистичных аватаров без исходного видео — по текстовому запросу или фото, которые можно сгенерировать тоже в HeyGen.

Сервис позволяет описать одежду, позу, фон и обстановку вокруг созданного персонажа. Доступно бесплатно.

Источник: HeyGen

На GitHub появился инструмент с открытым исходным кодом, который позволяет преобразовывать одни объекты на видео в другие — например, волка в дракона. Работает на основе модели Mochi от Genmo.

Источник: @logtd

Kling AI представила функцию для создания аватаров Custom Models.

Необходимо загрузить 10-30 видеороликов с реальным человеком или сгенерированным персонажем длительностью примерно 10 секунд каждый. На их основе сервис создаст модель с учётом внешности и мимики — её можно будет использовать для генерации видеосцен по текстовым запросам.

Функция доступна подписчикам Kling AI. Стоимость подписки — от $80.

Источник: @techhalla

Фото

Стартап Black Forest Labs выходцев из Stability AI добавил два новых режима в модели Flux 1.1 Pro. Режим Ultra генерирует изображения с разрешением до 4 Мп, что в четыре раза выше, чем у стандартной Flux 1.1

Режим Raw создаёт реалистичные изображения людей и природы, похожие на «спонтанные фотографии». Скорость генерации — около 10 секунд. Одно изображение стоит $0,06. Доступно через API, а также на Fal.ai, Replicate и Krea.AI.

Источник: Black Forest Labs
Источник: Black Forest Labs

Тексты

Anthropic представили новую модель Claude 3.5 Haiku и обновили Claude 3.5 Sonnet. Вторая теперь распознает визуальный контент в PDF-файлах.

Опция доступна через API — нужно включить в заголовок запроса anthropic-beta: pdfs-2024-09-25. Стоимость — $1 за 1 млн «входных» токенов и $5 за 1 млн «выходных».

Источник: Anthropic

Музыка

Нейросеть Suno AI теперь может сгенерировать целый музыкальный альбом из песен в едином стиле. Обновление позволяет создавать «персоны» на основе «вокала, энергии и атмосферы» опубликованных в сервисе песен и копировать их для других проектов.

Для этого нужно выбрать понравившийся трек, нажать на иконку с тремя точками и кликнуть на опцию Create, а затем — Make a Persona. Функция доступна в бета-версии по подпискам Pro и Premier.

Источник:  Suno AI
1919
33
11
11
6 комментариев

Когда уже можно будет порнуху клепать на этих поделках? Моей бурной фантазии не терпится.
Прогресс, прогрессируй активнее!

1

Уже клепают. Не отставай от прогресса.

2

5$ за 1 млн выходных!
Это мы берем !!!