Как создать говорящего ИИ-блогера (аватара) и публиковать видео в блог с его участием - полное пошаговое руководство. Для тех, кто не любит себя снимать, но хочет вести свой блог

Так как я являюсь ИИ-энтузиастом и техническим писателем, моя лента в социальных сетях представляет собой целую галерею сгенерированных ИИ медиа - изображений, аудио и видео. В последние недели невозможно не заметить одну тенденцию: появляющиеся вирусные видео с разговаривающими блогерами, созданные ИИ. Удивительно, насколько реалистично они выглядят (а иногда и пугающе).

Только посмотрите, насколько впечатляющими являются эти видео:

Честно говоря, в этих видео есть что-то, что кажется слишком искусственным, но в то же время нельзя отрицать, насколько далеко продвинулся ИИ за последние несколько месяцев.

Это умопомрачительно и в какой-то степени пугающе. Вы понимаете, что все развивается слишком быстро, когда люди, созданные искусственным интеллектом, начинают выступать на TED Talks.

На основе фотографий, сделанных на Ted Talk, люди начали создавать видео с помощью таких ИИ-инструментов, как Runway Gen-3 Turbo и Kling AI. Чтобы добавить последний штрих реалистичности, они добавили несколько сгенерированных ИИ голосов и синхронизацию губ с помощью RenderNet AI, чтобы оживить этих цифровых блогеров.

В этой статье я покажу вам полный процесс создания собственного «говорящего» блогера (аватара) с помощью четырех ИИ-инструментов:

Midjourney или Flux для создания изображений
Freepik Upscaler
Kling AI для преобразования изображения в видео
RenderNet AI для создания видео с синхронизацией губ

Если вам не хочется покупать подписки на все инструменты, то вам достаточно будет купить подписку на телеграм-бота SYNTX, в котором есть Midjourney, Flux и другие нейросети для создания изображений, апскейлер, Kling AI (а также Runway, Luma) для генерации видео, а также инструмент Синхронизатор губ и много других полезных ИИ-инструментов.

Давайте начнем.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Первым шагом будет создание фотореалистичных портретов вашего ИИ блогера. Вы можете использовать любой генератор изображений, но если вы стремитесь к первоклассной реалистичности, я рекомендую Midjourney или Flux.

Вот пример изображения, созданного с помощью Midjourney:

A cinematic photography, medium shot, glamour instagram latina woman. She has brown hair with purple highlights. glamour woman. She has a pretty face, She is sitting in a coffee in bar. An influencer, smiling face, with hand gestures as if she’s explaining something

Вот вариант, который мне нравится больше всего:

Играйте с промптом и создавайте столько изображений, сколько хотите, пока не получите идеальный снимок для вашего ИИ блогера.

Для этого шага я буду использовать Freepik image upscaler. Этот инструмент разработан компанией Magnific AI, поэтому есть гарантия, что результат будет действительно потрясающим.

Вот окончательный результат:

Следующий шаг - превратить портретные изображения, созданные в шаге 2, в реалистичные видео. Для этого нам понадобятся ИИ-инструменты для генерации видео, такие как Runway Gen-3, Kling AI, Vidu или Dream Machine от Luma.

Все эти ИИ-генераторы есть в телеграм-боте SYNTX, а в подписке Elite дается безлимит на генерации в Runway Gen-3 и безлимит на запросы к новой модели o1 от Openai.

Если вы не хотите платить за подписку, лучшей бесплатной альтернативой станет Kling AI. Kling предоставляет 66 ежедневных кредитов на генерацию видео, которых должно хватить на создание как минимум пяти 5-секундных роликов.

Перейдите на сайт Kling AI и создайте учетную запись. Перейдите на страницу AI videos и на вкладке «image reference» загрузите изображение нашего ИИ-блогера.

Добавьте следующее описание, чтобы помочь ИИ понять, какое видео вам нужно.

A woman smiling as she talks, use his hands as she talks, blinking eyes many times, looking at the viewer

Вы можете играть с промптом как угодно.

Вы можете настроить промпт по своему усмотрению. Если вы хотите, чтобы ваш ИИ блогер выглядел задумчивым, остроумным или даже слегка раздраженным - пропишите это в промпте. Только имейте в виду, что время обработки может варьироваться в зависимости от того, сколько видео от других бесплатных пользователей находится в очереди. Сейчас это может занять от нескольких минут до нескольких часов. Так что будьте готовы подождать.

Вот как выглядит готовое видео:

Примечание: Если у вас бесплатная подписка, время генерации на Kling AI будет зависеть от длины очереди. В данном примере генерация заняла почти четыре часа.

В качестве альтернативы вы можете воспользоваться Gen-3 Turbo от Runway, чтобы превратить изображение в видео. Они предлагают 300 кредитов для бесплатной генерации.

Вот финальное видео:

Потрясающе! Она выглядит такой живой. Мне нравится выражение ее лица, кажется, она с энтузиазмом делится своими секретами того, как стать вирусным блогером.

Но вот в чем дело: о чем именно она говорит? Вот тут-то и наступает следующий этап - добавление текста и синхронизация ее губ с ним.

Теперь, когда у нас есть видео, пришло время озвучить вашего ИИ-блогера. Для этого вы можете использовать любой бесплатный ИИ-чатбот, например ChatGPT от OpenAI, Gemini от Google или Claude AI от Anthropic.

Вот для начала простой промпт:

Write a single paragraph script for a 10-second video clip of an influencer sharing about her secret in going viral.

“Want to know my secret to going viral? It’s all about consistency, creativity, and engaging with your audience! Post regularly, keep your content fresh, and always reply to comments. That’s how I turn followers into a community and every post into a hit!”

Он короткий, милый и понятный - идеальный вариант для короткого ролика для блогеров.

Теперь переходим к последнему шагу - добавлениею голоса ИИ блогеру и синхронизацияю его губ с текстом. Для этого мы используем функцию Narrator в RenderNet AI.

Примечание: Эта функция не входит в 10 бесплатных ежедневных кредитов, предоставляемых RenderNet AI. Для использования этой функции необходимо приобрести кредиты. На генерацию 10-секундного видеоклипа будет потрачено 367 кредитов.

Чтобы начать работу, войдите в свою учетную запись RenderNet AI и перейдите на страницу «Narrator».

Примечание: Видео должно быть в формате MP4, с максимальным разрешением 2560x2560 пикселей и максимальной частотой кадров 60 fps.

Если вы хотите заменить лицо, у вас есть такая возможность, но в данном случае мы придерживаемся нашего оригинального творения.

Нажмите на кнопку Next и задайте голос и текст (используйте текст, который мы сгенерировали на шаге 3).

При выборе голоса убедитесь, что он соответствует ИИ-персонажу. В данном примере голос Рейчел идеально подошел для нашего ИИ блогера.

Затем нажмите кнопку Generate и дождитесь окончания процесса. Вы попадете в RenderNet Studio, где сможете при необходимости доработать видео.

Когда все будет готово, загрузите конечный результат. И вот оно - видео с говорящим ИИ блогером, где текст полностью синхронизирован с видео.

Это так здорово! Я так поражен тем, как это получилось. Я знаю, что это не идеально, но это невероятно, как далеко продвинулась эта технология. Я только что создал свое собственное видео с говорящим ИИ-блогером - это безумие!

В целом я получил массу удовольствия от этого эксперимента и вполне доволен конечным результатом. Удивительно видеть, что может создать один человек с помощью различных ИИ-инструментов за считанные минуты. Прогресс в области ИИ поистине поражает воображение, и это лишь вопрос времени, когда эти модели ИИ станут еще более мощными.

Представьте себе будущее, в котором любой человек сможет создавать полноценные выступления на TED или подробные обзоры товаров, имея лишь ноутбук и подключение к Интернету, и при этом ему не придется записывать себя. Это интересная и одновременно пугающая мысль.

Важно признать потенциальные риски, связанные с этой технологией. Если не будут приняты соответствующие меры, то дипфейки, фальшивые новости и политическая пропаганда могут легко распространиться. Ребята, давайте все будем использовать эти инструменты ответственно.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 30 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Kling, Suno, Синхронизатор губ, Редактор с 12 различными ИИ-инструментами для ретуши фото.
☝Это только часть функций, доступных в SYNTX!

NeuroЭнтузиаст (Алексей)

ChatGPT

5 окт

OpenAI представила функцию Canvas («холст»)в ChatGPT - совершенно новый интерфейс для написания текстов и программирования

Для тех, кто был разочарован отсутствием новых функций ChatGPT во время мероприятия DevDay, эта новость может стать приятным сюрпризом: OpenAI выпустила - Canvas, совершенно новую функцию, которая представляет новый способ работы с ChatGPT для задач по написанию текстов и программированию.

NeuroЭнтузиаст (Алексей)

5 окт

Meta* анонсировала скорое появление Movie Gen - нового ИИ-генератора видео и звука

Компания Meta вступает в борьбу, анонсировав Movie Gen - свой новейший инструмент для генерации видео и звука. Он способен решать сложные VFX-задачи: заменять окружение, добавлять декорации, менять персонажей местами и удалять предметы.

#ai #иибудущее #блогер

Источник статьи на английском - здесь