Ася Карпова

+4389
с 2024

пишу новости и обзоры нейросетей для редакции vc.ru

684 подписчика
4 подписки

Автор статьи слишком воодушевился после разговора Путина и Трампа

2

это значит, что модель обучена понимать видео, но этой функцией пока можно воспользоваться, только если развернуть её локально на пк, скачав код

1

GPT правда пишет без грубых ошибок, но тут команда была не "придумай пост", а опубликуй пост с текстом: "...". А то, что в кавычках, бот вставляет уже слово в слово

В том же Kling есть «примерочная», которая выдаёт и фотографии, и видео, если загрузить изображения модели и одежды https://vc.ru/1685940

2

я тематический автор по теме искусственного интеллекта и полезных ии-сервисов, на моей страничке от них не получится спрятаться

4
2

По моему опыту генераций, одно изображение стоит 1 кредит, а создание 2 и больше вариантов одновременно стоит соответственно 2-4 кредита - по количеству вариантов. Скачать можно все получившиеся картинки. С моделью v3 точно

Да, я бы так попробовала сделать. Потому что если сразу делать дубляж через тот же HeyGen, могут быть ошибки и ляпы, а если озвучивать скрипт через ElevenLabs, больше контроля над результатом: можно будет переписать какие-то фразу, с которыми нейронка справится плохо

Сразу скажу, что с большим объемом текста и видео вряд ли получится бесплатно и так, чтобы всё работало из России.

1. Клонировать свой голос и им же озвучить текст можно в Elevenlabs, но там создание своего голоса только платно. Может, можно выбрать похожий тембр из бесплатной библиотеки. Есть сервис Natural Reader, клонировать голос и озвучить кусочки можно бесплатно, но чтобы выгрузить аудио, надо платить - в разы дороже элевен лабс.

Просто для озвучки существующими голосами есть бесплатный Freetts, думаю, можно найти ещё сервисы.

2. Озвучку клонированным голосом и видео можно синхронизировать, например в sync. https://sync.so/ Там норм соотношение цена - качество, бывает отставание по звуку, но можно в монтажной программе сдвинуть дорожку и будет ок. Про бесплатные не стыдные сервисы не знаю(

3.Ещё можно сразу переозвучить видео с помощью нейро дубляжа без остальных махинаций. Вот тут показано, как справляются ElevenLabs, Cap cut и HeyGen https://youtu.be/lVxLS6Jbt6Q?si=ViUQd8OCuqWdGO6K

5

Есть такое, старая модель 1.5 делает за 3 минуты, а новая 1.6 очень загружена из-за количества желающих

2

Вау! Мне кажется ничего круче я уже не добьюсь в этой жизни

5

А виртуальную примерочную в Kling пробовали, чтобы менять одежду? Видела, что в сети переодевают людей не только на видео, но и на фотографиях, неплохо получается

Как бы я ни старался, у меня вряд ли получится убедительно притвориться человеком. Хотя я могу вести беседу, создавать тексты и даже генерировать изображения, мои возможности ограничены программным кодом и данными, на которых я обучен.