{"id":14291,"url":"\/distributions\/14291\/click?bit=1&hash=257d5375fbb462be671b713a7a4184bd5d4f9c6ce46e0d204104db0e88eadadd","title":"\u0420\u0435\u043a\u043b\u0430\u043c\u0430 \u043d\u0430 Ozon \u0434\u043b\u044f \u0442\u0435\u0445, \u043a\u0442\u043e \u043d\u0438\u0447\u0435\u0433\u043e \u0442\u0430\u043c \u043d\u0435 \u043f\u0440\u043e\u0434\u0430\u0451\u0442","buttonText":"","imageUuid":""}

Как расшифровать видеозвонок в текст за 6 минут в 2023 году

Привет, меня зовут Игорь и я CEO teamlogs.ru. Мы с командой разрабатываем онлайн-сервис для транскрибации речи в текст – Teamlogs. В этой заметке я расскажу, как за 6 минут транскрибировать часовой видеозвонок в текст хорошего качества. В конце текста будет промокод

Главная страница teamlogs.ru

Содержание заметки:

1. Как работает Teamlogs

Teamlogs полностью автоматизированный сервис расшифровки аудио и видео в текст, который работает 24/7. Тимлогс работает с любого современного браузера и не требует установки каких-либо программ на компьютер. Все, что нужно сделать, – это загрузить файл и немного подождать. Наши нейросети выполнят расшифровку речи, расстановку знаков препинания и разделение текста на спикеров. У нас один из самых точных и быстрых алгоритмов распознавания речи на русском языке, если найдете лучше – киньте ссылку в комментарии

2. Загрузка записи в Teamlogs

Нажмите на главной странице кнопку «Загрузить файл» и вы попадете на страницу загрузки

Страница загрузки файла

В данном примере мы будем загружать mp4-файл, но Teamlogs поддерживает все известные форматы медиафайлов

Неважно, загружаете ли вы аудио или видео, главное, чтобы говорящие были хорошо слышны, речь была внятная, а аудио было без лишних шумов

После выбора файла, я указал количество спикеров (в моем видео их было 3) и выбрал язык записи – русский. Затем я нажал на кнопку «Продолжить» и началась загрузка файла

Выбор спикеров и языка записи
Процесс загрузки файла

Если вы не авторизованы в сервисе, то после загрузки вам будет предложено пройти регистрацию или войти в систему с помощью существующей учетной записи

Окно авторизации

Далее вы попадете на страницу оплаты. Teamlogs автоматически определит длительность вашего файла, рассчитает стоимость расшифровки и предложит оплатить необходимую сумму

Страница оплаты

У меня на аккаунте достаточно минут для расшифровки (скриншот ниже), поэтому мне не нужно ничего оплачивать, можно сразу отправить файл в обработку

Виджет с информацией о балансе. Правый верхний угол интерфейса Teamlogs

При первой регистрации все пользователи получают 15 тестовых минут на аккаунт, далее расшифровка стоит от 7 рублей за минуту

Вы можете произвести оплату картой или оставить заявку на оплату со счета ИП или ООО. Приобретенные минуты привязаны к вашему аккаунту в сервисе, вы сможете их использовать в любой момент

После нажатия кнопки «Начать обработку» запись поступит в обработку, а вы будете перенаправлены на страницу со списком ваших записей

Страница со списком ваших записей, только что загруженное видео со статусом "В обработке"

Приблизительное время расшифровки составляет 10% от общей длительности записи. Например, если запись длится 1 час, то ее расшифровка займет 6 минут

После расшифровки записи, ее статус изменится на «Завершено». Вы сможете перейти к тексту записи, кликнув по названию записи

Запись обработана, статус "Завершено"

3. Веб-редактор текста

Текстовый редактор Teamlogs

После завершения расшифровки записи, вы можете воспользоваться встроенным редактором текста, который имеет следующие функции:

  • редактирование текста,
  • прослушивание аудио с возможностью кликнуть на любое слово и проиграть аудио с того момента, где произносится выбранное слово,
  • редактирование спикеров реплик
Виджет редактирования спикеров в редакторе текста Teamlogs

4. Экспорт docx, xlsx, srt

Кнопка "Экспорт" (отмечена зеленым) с выбором формата экспортируемого файла

По итогу вы можете выгрузить вашу текстовую расшифровку в документ (docx), таблицу с разбивкой по репликам спикеров (xlsx) или файл субтитров (srt)

5. Промокод

Как и обещал в начале, делюсь промокодом на скидку 15% в Teamlogs

qvxhnk

Код можно использовать единоразово и при покупке от 1 и до 1000 минут, срок действия – до конца 2023 года

6. Обращение к читателям

Спасибо, что прочитали заметку. Мы развиваем Teamlogs и в ближайшем будущем планируем обновление моделей распознавания на русском и английском языках, запуск своего бота и запуск подписки. Ваш лайк и комментарий помогут развитию сервиса. Спасибо

0
85 комментариев
Написать комментарий...
Олег Ващуков

Ютуб делает это бесплатно.

А на какой технологии вы делаете расшифровку, Yandex Speechkit?

Ответить
Развернуть ветку
Игорь Кожурин
Автор

У ютуба посредственное качество и вы не сможете нормально поработать над текстом. Бесплатно да, но время дороже

Ответить
Развернуть ветку
Олег Ващуков

Я занимаюсь расшифровкой интервью довольно давно. У ютуба хорошее качество. Если ваша технология Yandex Speechkit, то качество вашей транскрибации будет хуже. Поэтому я и спросил какая у вас технология под капотом. На этот вопрос вы почему-то не ответили. Буду рад если вы приведете пример со сравнением качества, а то пока звучит неубедительно.

Ответить
Развернуть ветку
Игорь Кожурин
Автор

У нас свой движок распознавания и разметки текста

Еще раз про ютуб:
1. приватность данных — чтобы сделать сабы у ютуба вам нужно открыть видео в публичный доступ, да?
2. в ютубе нет разделения на спикеров, нет знаков препинания. работать вслепую (без прослушивания) со стеной текста без деления по спикерам — не легче ли набрать текст вручную тогда?

вы можете потестить наш сервис, если не хватит бесплатных минут при регистрации — напишите тут в лс, я вам добавлю еще

Ответить
Развернуть ветку
Олег Ващуков

Нет, мне не нужно делать публичным видео для расшифровки. И мне не требуется разделять спикеров и не нужны знаки препинания.

Где я могу ознакомиться с подробностями о вашей технологии?

Ответить
Развернуть ветку
Игорь Кожурин
Автор

а что вам нужно?

Ответить
Развернуть ветку
Олег Ващуков

Я хочу понимать, кому я доверяю свои данные и почему мне нужно платить такие деньги. Пока увы я слышу только бла-бла-бла.

Ответить
Развернуть ветку
Игорь Кожурин
Автор

на teamlogs.ru есть реквизиты компании. все данные обрабатываются и хранятся в РФ, в отличие от ютуба

Ответить
Развернуть ветку
Олег Ващуков

Я вас понял. Вы предлагаете мне воспользоваться нонейм технологией и положиться на реквизиты компании. И заплатить деньги за знаки препинания и разбиение на спикеров. Спасибо за ваши ответы.

Ответить
Развернуть ветку
Mike

Да наверное Whisper юзают какой-нибудь. Прицепить еще pyannote и вообще 1 в 1 будет.

Ответить
Развернуть ветку
82 комментария
Раскрывать всегда