Как перевести видео нейросетью по самой низкой цене на рынке + озвучить тексты естественным голосом?
Сделали в KolerskyAI несколько разработок на эту тему и закинули их в бета-тестирование, так что уже можете пользоваться. В статье несколько примеров и описание.
Как устроен технически?
Полностью не можем рассказать, разумеется=))
Но если вкратце: берется видео, разделяется звук и видео. Звук режется на отрезки с сохранением временных рейтов и фоновых звуков, далее транскрибируется и озвучивается. После этого все отрезки накладываются на видео без звука, каждый в свой временной отрезок.
Что по переводу видео?
На основе нескольких нейросетей и скриптов сделали переводчик видео (а так же аудио) на 15 языков. Смогли сделать цену, ниже чем у конкурентов. Но, поскольку бета-версия - возможны глюки.
Цена переводе в доллары - от 0,23 за минуту перевода.У конкурентов цена минимум в 3 раза выше.
Примеры перевода
*больше примеров в видео снизу и в инструкции
Голоса и языки
Есть куча вариантов голосов для перевода, ниже несколько примеров. Так же есть вариант копирования голоса, но он пока нормально работает только на видео с одним спикером.
Виды языков ниже на картинке:
Что по озвучке текстов?
Можно озвучить и слушать нужный вам текст. Либо использовать функцию для озвучки рилс, шортс и всякого такого. Голосов тут меньше, но работает сильно быстрее перевода.
Тут есть полный список голосов для озвучки и перевода
Как пользоваться сервисом?
Пока он через тг бота без веб интерфейса, там все интуитивно понятно.
Инструкция и примеры: Тут есть подробная инструкция
ps. Обязательно пишите обратную связь, чтобы мы быстрее устраняли всякие глюки...)
Реклама в инстаграме - все? А мы еще успели. И расскажем об этом опыте. И ищем новые инструменты для привлечения дешевого и эффективного трафика.
Человек воспринимает глазами 80% информации и лишь 20% на слух. Транскрибация превращает эти 20% в текст, который не потеряется и будет работать на вас.
Перевод текстов с помощью нейросетей стал настолько качественным, что иногда кажется, будто языковые барьеры скоро исчезнут. В 2025 году выбор инструментов для перевода огромен, но мы собрали для вас ТОП-10 лучших нейросетей, чтобы вы могли выбрать подходящий сервис для своих задач.
Когда говорят про перевод YouTube в текст, многие представляют себе простую транскрибацию: загрузил видео → получил текст. И если бы мой бот делал только это, вряд ли в нем было бы что-то уникальное.
Единорог ElevenLabs объявил о создании своей ИИ модели Scribe, и сервис уже доступен. Расскажу, для чего может быть нужна модель и о чем говорит ее появление именно сейчас.
Платформа Hailuo AI предлагает инновационные инструменты для генерации видео с использованием технологий искусственного интеллекта. Сервис позволяет пользователям создавать видеоролики на основе текстовых описаний или статических изображений.
Лео в тему конечно
У вас громкость прыгает судя по примерам. Видимо то что куски озвучивали отдельно и слепляли
В Яндекс браузере бесплатно же, какой самый дешевый
С этим все хорошо кроме браузера.
В общем вот тоже самое но в любом браузере
https://github.com/ilyhalight/voice-over-translation
А как цену самую низкую сделали? Там же огромные корпорации эти штуки делают . Елевенлабс вон уже миллиарды стоит
Они скорее всего пока держат рамки по минимальной марже
Он исходный звук полностью гасит? Или отделяет голос от остального окружения?