Как расшифровать видеозвонок в текст за 6 минут в 2023 году
Привет, меня зовут Игорь и я CEO teamlogs.ru. Мы с командой разрабатываем онлайн-сервис для транскрибации речи в текст – Teamlogs. В этой заметке я расскажу, как за 6 минут транскрибировать часовой видеозвонок в текст хорошего качества. В конце текста будет промокод
Содержание заметки:
1. Как работает Teamlogs
Teamlogs полностью автоматизированный сервис расшифровки аудио и видео в текст, который работает 24/7. Тимлогс работает с любого современного браузера и не требует установки каких-либо программ на компьютер. Все, что нужно сделать, – это загрузить файл и немного подождать. Наши нейросети выполнят расшифровку речи, расстановку знаков препинания и разделение текста на спикеров. У нас один из самых точных и быстрых алгоритмов распознавания речи на русском языке, если найдете лучше – киньте ссылку в комментарии
2. Загрузка записи в Teamlogs
Нажмите на главной странице кнопку «Загрузить файл» и вы попадете на страницу загрузки
В данном примере мы будем загружать mp4-файл, но Teamlogs поддерживает все известные форматы медиафайлов
После выбора файла, я указал количество спикеров (в моем видео их было 3) и выбрал язык записи – русский. Затем я нажал на кнопку «Продолжить» и началась загрузка файла
Если вы не авторизованы в сервисе, то после загрузки вам будет предложено пройти регистрацию или войти в систему с помощью существующей учетной записи
Далее вы попадете на страницу оплаты. Teamlogs автоматически определит длительность вашего файла, рассчитает стоимость расшифровки и предложит оплатить необходимую сумму
У меня на аккаунте достаточно минут для расшифровки (скриншот ниже), поэтому мне не нужно ничего оплачивать, можно сразу отправить файл в обработку
Вы можете произвести оплату картой или оставить заявку на оплату со счета ИП или ООО. Приобретенные минуты привязаны к вашему аккаунту в сервисе, вы сможете их использовать в любой момент
После нажатия кнопки «Начать обработку» запись поступит в обработку, а вы будете перенаправлены на страницу со списком ваших записей
После расшифровки записи, ее статус изменится на «Завершено». Вы сможете перейти к тексту записи, кликнув по названию записи
3. Веб-редактор текста
После завершения расшифровки записи, вы можете воспользоваться встроенным редактором текста, который имеет следующие функции:
- редактирование текста,
- прослушивание аудио с возможностью кликнуть на любое слово и проиграть аудио с того момента, где произносится выбранное слово,
- редактирование спикеров реплик
4. Экспорт docx, xlsx, srt
По итогу вы можете выгрузить вашу текстовую расшифровку в документ (docx), таблицу с разбивкой по репликам спикеров (xlsx) или файл субтитров (srt)
5. Промокод
Как и обещал в начале, делюсь промокодом на скидку 15% в Teamlogs
Код можно использовать единоразово и при покупке от 1 и до 1000 минут, срок действия – до конца 2023 года
6. Обращение к читателям
Спасибо, что прочитали заметку. Мы развиваем Teamlogs и в ближайшем будущем планируем обновление моделей распознавания на русском и английском языках, запуск своего бота и запуск подписки. Ваш лайк и комментарий помогут развитию сервиса. Спасибо
Пример бы посмотреть на нескольких демо записях с разным качеством аудио (плохой интернет например), разным количеством собеседников. И выложить сравнение на сайт, а для достоверности самостоятельно своим сервисом записать и на видео записать и выложить. Проекты с распознаванием периодически появляются и потом умирают. Почему надо пробовать еще один новый? Любой новый сервис должен ловко уметь доказывать свою состоятельность
я закинул, внизу есть пример реальный
+100500
Даже просто кусочки аудио и их расшифровки
Здравствуйте, да подумаем над материалом с демонстрацией
мы можем вам выдать дополнительные тестовые минуты, чтобы вы проверили качество работы сервиса на своих данных
Комментарий недоступен
Ценник запредельный
Пойдёт! Продолжайте. Благодарю.
Насколько я понимаю, если заплатить за час расшифровки буквально процентов на 15-25 побольше, чем ваш самый дешевый тариф, можно получить всё тоже самое, но сделанное вручную и проверенное начальником. Это, если что, целая отрасль небольшая - ручная расшифровка текста. В связи с чем вопрос - что вообще происходит? Вы автоматизировать процесс не пробовали?))
У меня есть встречное предложение. Давайте вы начнете движение вниз где-нибудь от доллара за час расшифровки. А мы, ваши потенциальные потребители, увидим это и поймем, что коммерческая автоматическая расшифровка текста отныне - существует. Ну и подождем, пока вы придете в ум и перестанете от нас ждать аж целый доллар. Что скажете?)
Каким сервисом конференций пользуетесь?
Здравствуйте, час расшифровки у нас стоит 420 рублей ($6). Мы можем с вами обсудить отдельный оптовый тариф. Я могу вам выдать тестовые минуты, чтобы вы проверили качество расшифровки на своих аудио
Ютуб делает это бесплатно.
А на какой технологии вы делаете расшифровку, Yandex Speechkit?
У ютуба посредственное качество и вы не сможете нормально поработать над текстом. Бесплатно да, но время дороже
Годнота
О оч полезная вещь
Вот это очень нужная тема, нужно будет затестить!
Пользовался похожим сервисом, otter.ai. Он вам не конкурент, так как умеет только в английский язык, правда с учетом разных акцентов, включая русский. Очень спасало с одним франкоязычным говорящим на английском, самому было его сложно понимать, транскрибер же справлялся с его произношением.
По функциям — все тоже, но сверху
— автоматическое построение аутлайна / содержания
— интеграции с zoom / google meet / ms teams, не нужно (но можно) асинхронно загружать аудио/видео потом, можно делать на лету
— ассистент-бот сам может придти на митинг и все записать/разметить, полезно в случае параллельных митингов и нужно знать что было на каждом
— экшен айтемы, заметки
— заметно ДЕШЕВЛЕ, бесплатно 300 минут в месяц. Подписки дают 0.25/0.50 рублей за минуту в пересчете
Так что есть куда стремиться, продукт полезный, такие приятно видеть.
спасибо, много полезной информации
Я расшифровкой аудио никогда не занимался, но в этот раз точно займусь с помощью сервиса TeamLogs. Расшифровка от народа!
вам бы в политику
Второй коммент за 2 года
На основе chatGPT уже стартапы появились с расшифровкой видео в текст менее чем за 1 мин
кинете пару ссылок?
с русским языком?
а люди за эту работу платят деньги неплохие
Не могу лайк поставить почему то
раньше подрабатывала тем что писала как раз такую расшифровку
Хм, вообще есть много сервисов для транскрибации, как платных так без, хорошо бы сравнение какое-то сделать. Есть в мессенджерах функции расшифровки аудио, а из видео любого можно аудиодорожку легко выдернуть.
Да, сделаем
Полезно. Сохраняю.
М, а я правильно понимаю, что вы по сути заявляете, что ваша собственная разработка превосходит по качеству все существующие аналоги?
нет
Попробовал. Достойно! Не планируете API?
Здравствуйте, планируем. Если у вас есть конкретный запрос, то давайте обсудим в лс
ВСё совсем не так радужно, как описано в статье :(
Ниже в комментариях разбираемся с кейсом
Всё это, конечно хорошо... Но, "траскрибация"...
где-то опечатка?
Комментарий удален модератором
Комментарий удален модератором
Отличный сервис! Качество расшифровки огонь, очень близко к оригиналу. Правки минимальны. Запятые расставлены в нужных местах, это прям гуд. Спасибо огромное!
P.S. Ни реклама ни разу, есличо. Просто очень срочно нужна была такая прога для срочной расшифровки 2 часов разговора. Ну либо вручную набивать сидеть...в общем, спасли мои выходные))
Комментарий недоступен
нет
Комментарий удален модератором
Комментарий удален модератором
Комментарий удален модератором
от слов "расшифровки аудио" у вас пердак подгорает?
нет
А в прямом эфире может расшифровку давать?
сейчас только в записи
Не whisper под капотом?
похоже что он самый
что такое whisper и сколько оно стоит?
Невероятно нужный и полезный инструмент. ТОлько бы NDA вам какой-нибудь подписать, чтобы я мог спокойно отправлять все свои переговорные видосы спокойненько.
И ещё какой-нибудь оптовый тариф. Мне вот сейчас надо 2-3 тысячи минут, на расшифровку большой кучи видосов. Хочу как раз тестануть.
И если б был оптовый тариф на мой объём, было бы кайф.
А ещё у меня записи все на яндекс.диске, и 60гб грузить сначала себе, и потом вам - головняк.
Да, здравствуйте. NDA есть. Оптовый тариф тоже есть, это мы уже с вами обсуждаем в лс
По Яндекс диску: в частном порядке отработаем и на будущее запланируем интеграцию
К комментариям ниже:
Скорость обработки — посмотрели логи, ваша запись попала в очередь и действительно дольше обычного обрабатывалась. Так иногда бывает при высоких нагрузках на сервер
По качеству текста — много нюансов влияют на качество текста — от шумов на аудиодорожке, до невнятной речи. Поэтому могут быть моменты с ошибочным распознаванием, мы стремимся минимизировать этот параметр и регулярно работаем над улучшением моделей пост-обработки текста
Абзацы — тоже работаем в этом направлении. У нас есть модель по абзацам в альфа-версии, мы ее дорабатываем. Как будем готовы – зарелизим
По ошибке с редактированием текста — выясним с вами в лс. Сейчас проверили на своих записях — редактирование работает, сохраняет, аудио проигрывает
Пока что аудио 8 минут с норм качеством расшифровывается уже 14 минут)
Расшифровал медитацию. Довольно бестолково.
Без абзацев и пр.
Полотно текста. Что не удобно.
и текст не редактируется
сбрасывается сразу
Печально(
К сожалению, только потратил время на регистрацию и обрезку аудио для теста. Получившийся текст не подлежит анализу и не несет за собой никакой ценности. Ничто не заменит ручной расшифровки от ребят-фрилансеров с YouDo или, например, бота в телеге GoTranscribe
Здравствуйте, напишите в лс вашу почту аккаунта, посмотрим что с вашей записью не так. Если качество аудио хорошее и слышно отчетливо речь, то проблем быть не должно
Кажется что вы просто пришли насрать под дверью конкурента.
Это не прилично.
Эмммм.... Скорость транскрибации очень странная метрика. Мне лично, всё равно, оно за 7 минут отработает или за час. Главное что не в моменте дает результат.
Второй критерий – цена, 7 рублей это адъ.
Третий критерий – качество.
Здравствуйте, спасибо за комментарий. Некоторым пользователям важна скорость, поэтому и пишем