{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

7 сервисов транскрибации: сравниваю по скорости, цене и количеству ошибок

Когда мне говорят прийти куда-то где есть дресс код я всегда против, но когда сегодня мне все, вплоть до Андрюхи Аполлонова и организаторов, триста раз попросили чтобы я пришла в белом, я не могла не ослушаться и пришла в белом… Сравниваю лучшие российские транскрибаторы аудио и видеофайлов в текст. В конце статьи — крутая таблица для наглядности.

Привет, это Роман Рабочий — разработчик Писца, Маши-секретаря и сервиса Планёрка. Мне стало интересно сравнить нашего Писца-расшифровщика с другими сервисами автоматической транскрибации, которые распознают русский язык и принимают оплату с российских банковских карт. Рассказываю, что получилось.

Чтобы было не скучно читать, я взял старый добрый шедевр Реутов ТВ с Бузовой. Вот это видео:

Я не могла НЕ ослушаться 😂

По каким критериям буду сравнивать:

Частота ошибок в словах. На языке маркетинга это называется Word Error Rate или сокращенно — WER. Процент ошибок в распознавании слов от общего числа слов.

В общем, берем сто слов и считаем, сколько в них ошибок — это и есть процент WER.

Стоимость расшифровки — в минутах, часах или пакетах, неважно. О каждом сервисе пишу, сколько можно расшифровать бесплатно и сколько стоит то, что платно.

Скорость обработки. Специально выбрал видео чуть меньше минуты, чтобы было видно на небольшом формате — кто быстрее.

Знаки препинания — есть ли они вообще и насколько они адекватны.

Абзацы — есть или нет.

Разбивка текста на спикеров — крайне важная функция если на записи беседуют несколько человек, например, созвон в зуме или конференция.

Ну штош, погнали 🚀

1. Teamlogs

При входе на сайт сервис предлагает зарегистрироваться и дарит 15 бесплатных минут транскрибации. Можно войти через Гугл или Яндекс, чтобы не возиться с паролем и подтверждением. Перетаскиваем файл в окошко загрузки и ждем — текст откроется прямо в интерфейсе.

Что имеем:

  • Частота ошибок в словах: 18%.
  • Стоимость: бесплатно 15 минут. Потом зависит от количества минут: файл до получаса обойдется 20 ₽/мин, до часа 10 ₽/мин и так далее. Самая дешевая тарификация — 6 ₽/мин будет доступна если купите пакет размером в 5001 минуту за 30 тыс ₽.
  • Скорость: наш видос обработал за 2,5 минуты.
  • Знаки препинания: есть, но не все корректные.
  • Абзацы: есть.
  • Разбивка на спикеров: есть.

Вывод: есть разбивка на спикеров и абзацы — это хорошо. Ошибок в тексте довольно много, теряет часть реплик, пишет фамилии со строчной буквы, а вот «Белого» почему-то решил писать с заглавной. Если нужно расшифровать часовой файл — заплатите 600 ₽. Ну или покупайте пакеты за десятки тысяч рублей и тогда будет чуть дешевле.

Краткое содержание перед текстом получилось невпопад: «Спикер 0 не хочет идти в Белый, потому что ему постоянно звонит Андрей Аполлонов» 😛

2. Speechtotext

Сервис встречает приглашением пройти регистрацию. Тапнуть в логотип Гугла или ВК не получится — придётся дважды вводить пароль и подтверждать аккаунт через почту. Теперь загружаем файл, ждем и читаем результат прямо на сайте. Ну или скачиваем в формате doc.

Ошибок меньше, чем у предыдущего коллеги, но читать тяжеловато

Что имеем:

  • Частота ошибок в словах: 9%
  • Стоимость: бесплатно 10 минут, потом 100 ₽ в час.
  • Скорость: около 10 секунд.
  • Знаки препинания: есть, но много некорректных.
  • Абзацы: ну один поставил, рандомный.
  • Разбивка на спикеров: нет.

Вывод: ошибок в тексте немного, но они напряжные. Принципиально неправильные слова: «официант Андрюшка Аполлонов». Начало и окончание предложения определены неверно и искажают смысл: «…да, когда он 300. Раз меня все предупредили…» Представьте, если в часовом созвоне будет таких ошибок штук 30? Будет очень сложно что-то понять.

3. Conspecto

На главной странице написано, что сервис конвертирует в текст «с помощью самой совершенной на сегодняшний день модели искусственного интеллекта». Различает 50 языков, поддерживает много форматов и не требует регистрации. Еще у сервиса есть телеграм-бот, но нам его тестить лень и мы сделаем все в браузере.

Текст можно прочитать на сайте и скачать в TXT, HTML или DOC

Что имеем:

  • Частота ошибок в словах:1%
  • Стоимость: бесплатно одна минута, потом 3 ₽/мин за транскрибацию или 4 ₽/мин за нее же, но с конспектом.
  • Скорость: 20 секунд.
  • Знаки препинания: есть, вполне ок.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: текст чистенький, почти без ошибок. Хорошо, что есть тг-бот. Маловастенько дают бесплатно, всего одну минутку, но хозяин — барин. Плохо, что текст сплошняком. Фирменная фишка сервиса — конспект, с ним транскрибация стоит на руб дороже (буквально). Я заказал расшифровку с конспектом, смотрите что получилось:

Ну как-бы ок 🤷‍♂

4. Any2text.ru

На главной странице нас встречает окошко, в которое нужно перетащить файл для транскрибации. Сервис поддерживает много языков и предлагает скачать расшифровку в нескольких форматах на выбор — docx, xlsx, srt или txt. Регистрироваться не нужно, просто загружаете файл, ждете и смотрите результат.

Прикольная фича — если нужна расшифровка с ютуба, можно просто вставить ссылку

Что имеем:

  • Частота ошибок в словах: ошибок нет, маладэц.
  • Стоимость: бесплатно 15 минут. Потом 5 ₽/мин транскрибации если не регистрируешься. Если зарегистрироваться и пополнить баланс на тыщу рублей — 4 ₽/мин.
  • Скорость: наше видео обработал за одну минуту.
  • Знаки препинания: есть, корректные.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: шустрый, чистый сервис, переводит без ошибок. Часовой видос обойдется в 300 рублей или в 240 со скидкой после регистрации. На абзацы и спикеров не делит: если у вас многочасовой созвон в зуме на пять человек, замучаетесь потом вручную разбивать и разбирать, кто где говорит.

5. WordWoice

При входе сервис предлагает зарегистрироваться по почте или через ВК. После регистрации в личном кошельке оказывается 90 рублей, которые можно потратить на тестовую расшифровку. Под окошком загрузки — чек-бокс для иностранного текста, если его отметить, предлагает сделать перевод.

Результат можно прочитать на сайте и скачать файлом. А ещё можно послушать или скачать аудиофайл

Что имеем:

  • Частота ошибок в словах: 2%.
  • Стоимость: 5 руб/мин, при регистрации дарят 90 ₽.
  • Скорость: 40 секунд.
  • Знаки препинания: есть.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: хороший, чистенький перевод и стильный интерфейс. Разбивает текст на таймкоды, ставит их даже посреди предложения. Удобно, что можно тыкнуть в тайм-код и прослушать этот момент в аудиозаписи. В скачанном файле транскрибации таймкодов нет — просто текст сплошняком. Расшифровка часового созвона обойдется в 300 ₽.

6. Apihost

Apihost — солидный набор сервисов по работе с аудио и текстами. Он умеет в озвучку, изменение голоса и еще кучу всего. В том числе есть и транскрибатор. Чтобы загрузить файл, нужно зарегистрироваться. После регистрации в личном кабинете было написано, что у меня баланс ноль рублей — про бесплатные минуты я нигде ничего не нашел. Но я рискнул загрузить наш видос. И…

Такой приличный сервис — и матом матерится 😂

Что имеем:

  • Частота ошибок в словах: 18%
  • Стоимость: 2,4 руб/мин
  • Скорость: 25 секунд.
  • Знаки препинания: есть, какие попало.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: ну, такое. Что матом ругается — полбеды. Что имена пишет со строчной — тоже простим.. Но транскрибатор неправильно определяет начало и конец предложения, сливает очевидно разные предложения в одно — длинное и бессмысленное. Получается эталонное нечитаемоеполотнотекста. За час текста — 144 ₽, пополнять можно минимум на 500 ₽. Максимальный размер файлов для загрузки — 200 мб, маловато.

7. Писец

И на сладенькое — наш Писец. Я не буду расхваливать нашего ИТ-пушистика и честно сравню его с другими конкурентами. Регистрироваться на сервисе не надо, заходим на сайт, грузим файл, указываем почту и выбираем количество спикеров — от одного до пяти. После этого можно закрыть браузер и идти пить кофе, текст придёт на почту.

Писец называет спикеров персонажами книги Алана Милна — просто для настроения;)

Что имеем:

  • Частота ошибок в словах: 2%
  • Стоимость: бесплатно один час в месяц на высокой скорости. Потом тоже бесплатно, но медленнее.
  • Скорость: 40 секунд.
  • Знаки препинания: есть.
  • Абзацы: есть.
  • Разбивка на спикеров: есть.

Вывод: Писец недослышал одно слово в первой реплике и один раз пропустил слово «какой». При этом он крайне хорош в том, чтобы определять реплики спикеров и назначать им таймкоды.

Мы предлагаем всем пользователям один час расшифровки в месяц бесплатно на высокой скорости. А потом — тоже бесплатно, но медленнее.

А если хотите быстрее — можно купить пакет минут по очень демократичной стоимости:

990 ₽ за 10 часов (1.65 ₽/мин)

1620 ₽ за 20 часов (1,35 ₽/мин)

1980 ₽ за 30 часов (1,1 ₽/мин) с постобработкой в ChatGPT.

Пакеты минут не ограничены во времени использования — можете за месяц потратить или на несколько лет растянуть.

Так, ну и теперь сравнительная табличка

Приглашаю вас попробовать нашего Писца-транскрибатора в деле!

Загружайте созвон, конференцию, видеолекцию — всё что вашей душе угодно! Писец всё расшифрует, поставит запятые и абзацы, разобьет текст на спикеров, чтобы сэкономить ваше время и нервы.

0
17 комментариев
Написать комментарий...
Alexey Zholobov

Там whisper3 вышел, кому теперь вообще эти платные сервисы по распознаванию сдались?

Ответить
Развернуть ветку
Сергей Епифанцев

А он умеет на спикеров делить? 🤔

Ответить
Развернуть ветку
Alexey Zholobov

whisperX умеет

Ответить
Развернуть ветку
Невероятный Блондин

Ром, это же самый пост тут уже был несколько дней назад от аккаунта под названием Писец. То есть от тебя же.

В чем суть повтора публикации? Или у людей память золотых рыбок?

Или ты хочешь донабрать клиентуру?

Ответить
Развернуть ветку
Роман Рабочий
Автор

Мне было интересно сравнить как влияет количество подписчиков автора на успех статьи.
Пока что вывод такой, НИКАК )
Больше я так делать конечно же не буду.

Ответить
Развернуть ветку
Невероятный Блондин

Мог бы меня спросить, и я бы тоже самое ответил — никак )))

Подписчики имеют смысл только если они нажали еще и на колокольчик, а так это просто попадание во вкладку «Моя лента», а туда не все ходят.

Все сидят во вкладке «Популярное»

Да, пиши от себя, ты уже знаменит, и сразу понятно чей продукт. А то писец какой-то мутный, хрен знает ))

Ответить
Развернуть ветку
Роман Рабочий
Автор

ха, спасибо )

Ответить
Развернуть ветку
Olga Olga

Мутный)) мой любимый
Я не знала Романа, нашла продукт по статье писца, так что не надо недооценивать каналы лидогенерации, потому как планирую пост написать про этот сервис (уж больно он в самое сердце попал). Особенно "подкрасться незаметно"
ЕСТЬ ВОПРОС:
Знаете, что я не увидела в Вашем писце? инфо про конфиденциальность записей и их расшифровки. Как я понимаю. это не предусмотрен?

Ответить
Развернуть ветку
Сергей Епифанцев

Очень смешной видос выбрали для расшифровки))

Ответить
Развернуть ветку
Ольга Николина

это были прекрасные времена

Ответить
Развернуть ветку
Поросенок Пётр

кликбейт какой-то...

Ответить
Развернуть ветку
Роман Рабочий
Автор

Да ладно тебе.
Всё по делу же?

Ответить
Развернуть ветку
Сергей Епифанцев

А почему кликбейт?

Ответить
Развернуть ветку
Dany Sh

Хочется уже табличку по всем сервисам с постоянно актуализированной информацией для сравнения)

Ответить
Развернуть ветку
Павел Пучинин

а есть данные по качеству диаризации?

Ответить
Развернуть ветку
Julia Julia

Интересно! Спасибо 🔥

Ответить
Развернуть ветку
Юрий Нестеренко

Попробую!

Ответить
Развернуть ветку
14 комментариев
Раскрывать всегда