Нейросеть дня «AI Transcription»: транскрибируйте бесплатно на 100+ языках
Перевод аудио или видео в текст — адовая работа. На транскрибацию 10 минут может уйти до одного часа при нормальной скорости печатанья. Если лень самим, можно обратиться к фрилансерам по 500 рублей за 30 минут. А можно сделать то же самое бесплатно и за пару минут.
AI Transcription — сервис для автоматической транскрибации, который преобразовывает аудио и видео файлы (MP3, WAV, MP4 и MOV) в текстовые документы. Фактически, это нейросеть Whisper, которую ребята из Riverside (заслуживает отдельного обзора) обернули в удобный интерфейс. Поддерживает более 100 языков, отделяет речь разных людей (в диалоге) и проставляет таймкоды. Прекрасно справляется с русским языком и даже проставляет знаки препинания. Подобного качества автоматической транскрибации мы пока не встречали.
Что умеет AI Transcription от Riverside:
- Точное преобразование аудио и видео файлов в текст на более 100 языках
- Идентификация говорящего в многоголосых записях
- Проставление таймкодов
- Сохранение в формате субтитров
Доступен бесплатно без регистрации. Загружаешь файл и через пару минут получаешь расшифровку.
-----
Обзор новой нейросети каждый день. Удобнее читать в Telegram — https://t.me/universe_ai
Как продакт часто расшифровываю длинные интервью с пользователями. Этот сервис просто game changer: отличное качество текста на выходе на русском и английском
Спасибо за инфу, если правда (щас не поймешь просто человек написал нейтрально-позитивный коммент или это бот хвалит автора расплывчатыми формулировками). Над попробовать.
Добрый день, не подскажите как быть с видео, которые идут два, три часа. Чтобы получался хороший, адекватный текст
Кто может такую штуку к битрикс24 прикрутить чтобы телефонные разговоры обрабатывать пишите в личку
https://qa.SalesAI.ru
Написал в личку)
Для подкаста мастхэв) попробую) спасибо
Рекомендую посмотреть основной продукт Riverside, в котором расшифровка одна из фичей. Незаменимая вещь для подкастинга
Ну не прям мастхэв, но хорошо.
Я сделал очень похожее, но еще на спикеры делю текст
https://planerka.app/transcription/
И получилось очень круто!
Решил 1ый попавшийся разговор менеджера с клиентом в своём интернет-магазине попробовать распознать.... что-то качество ну так себе)
Попробуй https://SalesAI.ru
Только стерео лучше
2-3 часа лекции потянет?
у меня аудио длительностью 1 час 57 мин транскрибировало за 5-6 минут и качеством поражен, очень хорошо.
Такие длинные не пробовали, надо тестить
Слишком долго, не все осилят
Внутри whisper и качество так себе.
+ Не умеет на спикеров делить.
И это фиаско...
Да, я вот попробовал и расстроился, что нет разделения...
Да ладно. Даже встроенный ютубовский автопереводчик часто ошибается, если невнятно произносится слово. Иногда на один ролик бывают десятки ошибок.
Расшифровывает действительно достаточно точно на фоне других сервисов, ошибки всегда возможны, если на входе низкое качество
Зависит от видео многое. Бывает, что перевод вполне корректный, но да, вы скорее правы.
Супер
Неплохая конкуренция .Хотя неизвестно когда твоя очередь подойдёт для расшифровки- счетчика на сайте нет - например тут есть счетчик ( в черном маленьком квадрате цифры) справа в верхнем правом углу https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
Круто, спасибо, но непонятно как на спикеров делить... (
Про телефонные звонки мне рассказывали что когда качество хреновое, то даже человек, если он не в теме про что идёт разговор, часто не может расшифровать. Если хороший диктор, хороший звук, то все расшифровывается хорошо, если говорящий бэкает и мэкает, грит нинятна, то часто все такие сервисы начинают тупить.
Спасибо большое! Офигенная вещь, 1ч20 мин всего за несколько минут и со знаками препинания и очень точно, благодарю
Огонь! Спасибо за пост про эту нейросеть, не знал!
Попробовал на небольшом видео - получил отличный текст. Сейчас загрузил большое видео на 3 часа - пока "думает" и распознает, зависло все... МОЯ МЕТОДИКА: брать видео, вытаскивать из него текст с помощью этой нейросети, затем текст вставлять в GPT чат и просить сформировать статью на основе этого текста с ютюба, и вуаля - получается статья на основе видео.
мы делаем https://teamlogs.ru/ – сервис для перевода аудио в текст. Онлайн-сервис распознает речь из любого медиафайла, делит на спикеров. Готовый текст можно редактировать прямо в браузере, а далее стенограмму можно экспортировать в документ (docx, xlsx, srt)
буду благодарен обратной связи по работе сервиса
чем видос компрессил?
записывал квиктаймом?
Да, запись делал через QuickTime. Ужимал через пересылку в телеграмм, тупой, но эффективный способ
Есть у них API?
Кажется, нет, поскольку это одна фича большого сервиса для подкастеров. Но сделано это на нейросети Whisper от Open AI, который как раз работает по API
+
А как монетизируете? API Whisper недорогое, но не бесплатное. Или используете серверную версию и маленькую модель?
Этот сервис принадлежит Riverside, это платформа для создания подкастов, монетизируют через неё
Чёта я её попробовал потестить вчера, она загрузила видос, а дальше на 0% зависла. Сейчас проверил это окно, а обработка так и не сдвинулась. Кто-то пробовал ещё? Получалось?
Сильно зависит от нагрузки на сервер, у меня вчера днём всё летало. Возможно, в будние дни всё не так радужно
Комментарий недоступен
Комментарий недоступен
Скорость зависит от загрузки, рекомендую пробовать днём, пока Америка не проснулась
Там региться надо, походу. Наверно ещё абонку попросит? Пишу в авг 23го
На 9 сентября всё ещё бесплатно и без регистрации
Там региться надо, походу. Наверно ещё абонку попросит. Пишу в авг 23го
Не понятно где вставить файл, то что показано на видео совершенно не видно на сайте..
Нужно нажать на надпись «or upload a file»
пользуемся, любим)
Загрузил 10-минутный аудиофайл. Распознал, но скачать расшифровку не дает, просто ничего не происходит.
Значок намекает, что видимо надо апгрейдиться.
Ужасный,отвратительный перевод. Абсолютно теряется смысловое содержание текста по существу! Разработчики решили поразвлекаться.Просто нет на это время.Легче самому перевести аудио в текст,чем пользоваться этой программой!
Привет
сейчас затестим
Шляпа полная, 2 часа крутит что переводит файл и все
Ноябрь’23
С мобильной версии - моментом выгрузил.
На маке - завис на 0%.
Большое спасибо за наводку!
Бесплатно только ознакомление, почти все функции ограничены, а цены - 60 долларов в год за 300 мин в месяц и 150 долл в год за 2400 мин в мес.
Что сервис бесплатный, конечно большой плюс и качество действительно на высоте. Заметил интересный минус. Точность системы зависит от продолжительности загруженного файла. Загружал mp3 аудио больше часа и обрезанное до 10 минут. Качество различается, если звучание не идеальное.
Используют похоже разные модели
Добрый день, есть похожее десктопное приложение, у меня 4080 на борту очень долго онлайн выгружать
Транскрибирует классно, но даже русское аудио переводит текстом на англ. Подскажите, пожалуйста, как получить транскрипцию на русском языке?
спасибо за информацию, но на счет 2ух минут..... висит 10 минут и 0% транскрибации
Виспер вообще штука сомнительная.
я скачал ютуб ролик. вырезал звук. запихнул в него.
ролик 50 минут переваривал на процессоре он его больше часа.
Короче фишка в чем. вначале вообще не пишет текст. пропустил пару предложений.
потом начинает и внезапно "за сабы спасибо Симону"
какому симону в файле этого нет мп3.
вообщем что то он тащит непонятно откуда. но явно не из файла. а процессор напрягает и 10 гигов озу жрет.
Сейчас данная прога не нужна. ставите прогу пинокио. в нем в поиске вбиваете whisper этот. он скачивает все компоненты кнопка инстал потом старт. и вот тебе виспер через веб интерфейс бесплатно