Как расшифровать видеозвонок в текст за 6 минут в 2023 году
Привет, меня зовут Игорь и я CEO teamlogs.ru. Мы с командой разрабатываем онлайн-сервис для транскрибации речи в текст – Teamlogs. В этой заметке я расскажу, как за 6 минут транскрибировать часовой видеозвонок в текст хорошего качества. В конце текста будет промокод
Содержание заметки:
1. Как работает Teamlogs
Teamlogs полностью автоматизированный сервис расшифровки аудио и видео в текст, который работает 24/7. Тимлогс работает с любого современного браузера и не требует установки каких-либо программ на компьютер. Все, что нужно сделать, – это загрузить файл и немного подождать. Наши нейросети выполнят расшифровку речи, расстановку знаков препинания и разделение текста на спикеров. У нас один из самых точных и быстрых алгоритмов распознавания речи на русском языке, если найдете лучше – киньте ссылку в комментарии
2. Загрузка записи в Teamlogs
Нажмите на главной странице кнопку «Загрузить файл» и вы попадете на страницу загрузки
В данном примере мы будем загружать mp4-файл, но Teamlogs поддерживает все известные форматы медиафайлов
После выбора файла, я указал количество спикеров (в моем видео их было 3) и выбрал язык записи – русский. Затем я нажал на кнопку «Продолжить» и началась загрузка файла
Если вы не авторизованы в сервисе, то после загрузки вам будет предложено пройти регистрацию или войти в систему с помощью существующей учетной записи
Далее вы попадете на страницу оплаты. Teamlogs автоматически определит длительность вашего файла, рассчитает стоимость расшифровки и предложит оплатить необходимую сумму
У меня на аккаунте достаточно минут для расшифровки (скриншот ниже), поэтому мне не нужно ничего оплачивать, можно сразу отправить файл в обработку
Вы можете произвести оплату картой или оставить заявку на оплату со счета ИП или ООО. Приобретенные минуты привязаны к вашему аккаунту в сервисе, вы сможете их использовать в любой момент
После нажатия кнопки «Начать обработку» запись поступит в обработку, а вы будете перенаправлены на страницу со списком ваших записей
После расшифровки записи, ее статус изменится на «Завершено». Вы сможете перейти к тексту записи, кликнув по названию записи
3. Веб-редактор текста
После завершения расшифровки записи, вы можете воспользоваться встроенным редактором текста, который имеет следующие функции:
- редактирование текста,
- прослушивание аудио с возможностью кликнуть на любое слово и проиграть аудио с того момента, где произносится выбранное слово,
- редактирование спикеров реплик
4. Экспорт docx, xlsx, srt
По итогу вы можете выгрузить вашу текстовую расшифровку в документ (docx), таблицу с разбивкой по репликам спикеров (xlsx) или файл субтитров (srt)
5. Промокод
Как и обещал в начале, делюсь промокодом на скидку 15% в Teamlogs
Код можно использовать единоразово и при покупке от 1 и до 1000 минут, срок действия – до конца 2023 года
6. Обращение к читателям
Спасибо, что прочитали заметку. Мы развиваем Teamlogs и в ближайшем будущем планируем обновление моделей распознавания на русском и английском языках, запуск своего бота и запуск подписки. Ваш лайк и комментарий помогут развитию сервиса. Спасибо
Ютуб делает это бесплатно.
А на какой технологии вы делаете расшифровку, Yandex Speechkit?
У ютуба посредственное качество и вы не сможете нормально поработать над текстом. Бесплатно да, но время дороже
Я занимаюсь расшифровкой интервью довольно давно. У ютуба хорошее качество. Если ваша технология Yandex Speechkit, то качество вашей транскрибации будет хуже. Поэтому я и спросил какая у вас технология под капотом. На этот вопрос вы почему-то не ответили. Буду рад если вы приведете пример со сравнением качества, а то пока звучит неубедительно.
У нас свой движок распознавания и разметки текста
Еще раз про ютуб:
1. приватность данных — чтобы сделать сабы у ютуба вам нужно открыть видео в публичный доступ, да?
2. в ютубе нет разделения на спикеров, нет знаков препинания. работать вслепую (без прослушивания) со стеной текста без деления по спикерам — не легче ли набрать текст вручную тогда?
вы можете потестить наш сервис, если не хватит бесплатных минут при регистрации — напишите тут в лс, я вам добавлю еще
Нет, мне не нужно делать публичным видео для расшифровки. И мне не требуется разделять спикеров и не нужны знаки препинания.
Где я могу ознакомиться с подробностями о вашей технологии?
а что вам нужно?
Я хочу понимать, кому я доверяю свои данные и почему мне нужно платить такие деньги. Пока увы я слышу только бла-бла-бла.
на teamlogs.ru есть реквизиты компании. все данные обрабатываются и хранятся в РФ, в отличие от ютуба
Я вас понял. Вы предлагаете мне воспользоваться нонейм технологией и положиться на реквизиты компании. И заплатить деньги за знаки препинания и разбиение на спикеров. Спасибо за ваши ответы.
Комментарий удален модератором
Это мне еще велосипед подарили
Да наверное Whisper юзают какой-нибудь. Прицепить еще pyannote и вообще 1 в 1 будет.
дядь, ну ты и душный, просто жесть
хранение данных в рф теперь преимущество?