Как сервис распознавания речи и транскрибации Any2text расшифровал сюжет из «Что? Где? Когда?» и видео из TikTok: подробный тест

Продолжаем расшифровывать всё и вся в поисках лучшего решения. Всё-таки помощников в этих делах для авторов, редакторов да и самих предпринимателей — много не бывает. Сегодня тестируем Any2text, сервис для распознавания речи и транскрибации в пару кликов.

Первый клик уже на главной
Первый клик уже на главной

Первое впечатление

С первого взгляда — интерфейс понятный и простой, без визуального шума. Да и вообще, чем проще оформление в таких инструментах, тем эффективнее и приятнее работается. Также я сразу обратил внимание, на то, что у сервиса подписка «по объёму», а не «по времени использования». Это занятное УТП, я такого не видел у конкурентов.

Не буду тут сильно распыляться и рассказывать, как именно такие сервисы упрощают работу, рутину и повседневность. Вы и сами, наверное, понимаете. Ну, или уже немного разобрались по моим обзорам. Они, как секретари, помощники и ассистенты — разбирают нудные задачки, оставляя нам самый сок.

Конкретно в отделе контента или пиара — у спецов много однотипных функций. Приходится всё время с кем-то общаться, что-то искать, обрабатывать, проверять, компоновать, сокращать.

Бесконечные планёрки, созвоны, интервью. И вот для всего этого, чтобы лишний раз не лезть на стену — мы и тестируем сервисы вроде Any2text, который уже производит приятное впечатление.

Что по ценам?

По стандарту есть два варианта использования сервиса — бесплатно и без регистрации (но с ограничениями) или же с регистрацией и приятным бонусом.

Без регистрации даётся 15 минут для первого ознакомления, а после короткой анкеты к этим 15 минутам добавят ещё час. Бонус крутой, это правда.

Тарифы по минутам, для тех, кто ценит рациональный подход
Тарифы по минутам, для тех, кто ценит рациональный подход

Тарифы слегка выше, чем у сервисов, которые я тестировал, но там буквально копейки, так что несущественно. Жирный плюс в том, что подписка на сервис основывается на объёме — кроет любые неудобства.

То есть, можно единоразово оплатить подписку на 1000 минут и пользоваться всеми благами в течение года, не сожалея о неиспользованных минутах в подписке на месяц.

А ещё можно получить скидку в 20% за приглашённого друга. Такая партнёрка выглядит максимально дружелюбно и в ней реально можно поучаствовать для дела.

Что по заявленным функциям?

Основные плюшки Any2text:

  • Быстрый перевод аудио в текст
  • Чёткий перевод видео в текст
  • Автоопределение и распознавание более 50 языков
  • Неограниченный хронометраж видео и аудио для преобразования
  • Большое разнообразие форматов

Что же, давайте пробовать.

Обещанное видео

Итак, я решил сразу дать сервису задание, так сказать, повышенной сложности — расшифровать небольшое видео из интеллектуальной игры «Что? Где? Когда?». Сами понимаете, там крики, шум, куча голосов.

Но, прежде чем оценивать результат, хочу показать, как выглядит «внутрянка» сервиса.

Заблудиться тут просто негде
Заблудиться тут просто негде

И отметить классный UX — пока ждёшь расшифровку, вместо «Идёт загрузка», тебя подбадривают и веселят какой-нибудь милой фразой, которая ещё и меняется каждый раз. Что-то вроде комплимента от шефа, выглядит круто.

Хоть и не отчаиваешься, а приятно
Хоть и не отчаиваешься, а приятно

А вот и сам результат расшифровки нашего видео. С первого взгляда кажется, что текст немного сумбурный. Но если глянуть исходник, вы увидите, насколько хорошо сработал сервис. Помехи (фоновый шум, спутанная речь, перекрикивания) действительно могут сильно мешать алгоритмам, но не в этом случае.

Сложно даже представить, сколько бы ушло времени на ручную расшифровку такого формата...

Не потерялась ни одна реплика
Не потерялась ни одна реплика

Также я решил попробовать расшифровать видео из TikTok на тему «Признаки, что ваша кошка балуется». Почему бы и нет. Этот формат я, вообще, никогда не тестировал, так что любопытно.

Текст расшифровался за пару секунд: быстрее быстрого. Единственное, он не разбит на абзацы. Но думаю, это связано с тем, что ролик короткий, на одну тему, а текст читает единственный "спикер".

Избалованные питомцы они такие
Избалованные питомцы они такие

На десерт — выступление из TED на английском языке. Тоже пригодная расшифровка + заняла секунд 15. Грамматика и пунктуация на твёрдую пятёрку. Правда и здесь текст не разбит на абзацы, но это не так страшно.

Просто полезное чтиво для тех, кто хочет преуспеть в своей работе
Просто полезное чтиво для тех, кто хочет преуспеть в своей работе

Не обещанное, но аудио

Ну, и как же не потестить аудио, если дают? Тут две дорожки, на русском и на итальянском языках, для разнообразия.

Пока думал, какие материалы взять для теста, пришёл к мысли, что такие сервисы очень выручают людей с повышенными потребностями, например, слабовидящих. У них, вероятно, не всегда есть возможность записать свои мысли в документ или использовать голосовой ввод. Так что кому-то плюсик в карму.

К слову, в Any2text действительно не ограничивают длину аудио для расшифровки. Сам интерфейс простой и удобный, а все надписи — довольно крупным шрифтом. Ещё порадовало отсутствие всплывающих окошек и анимации, которая может сбить с толку. Короче, чувствуется, что делают сервис для людей.
Ну да ладно, продолжим с аудио. Мне, как писателю и журналисту — часто нужно куда-то деть свои мысли, идеи и наработки. И может быть полезно в моменте записать аудио вместо тысячи слов.

Так что здесь я попробовал расшифровать целый рассказ, на пробу. Вышло классно, все знаки на месте.

Многоуважаемый Брэдбери, для ценителей
Многоуважаемый Брэдбери, для ценителей

И тихо-медленно-быстро переходим к сказке на итальянском языке. Я взял небольшой кусочек из «Алисы в стране чудес». На всякий случай, проверил расшифровку через переводчик (всё чётко). Ну, и здесь уже текст поделён на абзацы, поэтому читать одно удовольствие.

Ле авентурэ ди'Элис, ну вы поняли
Ле авентурэ ди'Элис, ну вы поняли

В заключение

Итак, я однозначно положу в свою невидимую копилку этот инструментик.

Что понравилось?

  • Простой, как три рубля, интерфейс сервиса
  • Разумная подписка с оплатой за объём — для тех, кто нечасто сталкивается с расшифровкой
  • Предельно быстрая работа
  • Достойное качество расшифровки (самое-то главное)
  • Разнообразие языков и форматов
  • Дружелюбный Tone of Voice (кому-то очень важно, мне в том числе)
  • Как бонус: сервис не хранит ваши расшифровки больше дня, поэтому с конфиденциальностью тоже всё в порядке

Единственное, хотелось бы иметь возможность редактировать имена говорящих и делиться ссылкой на результат расшифровки. Зачастую авторы / редакторы / пользователи расшифровывают аудио с двумя участниками и самостоятельно вычитывают черновики, поэтому сменить имена вручную несложно. И всё же команде проекта есть, куда расти.

И на этом про Any2text всё. А к дорогим читателям у меня вопрос: какой же тип подписки всё-таки лучше — по объёму или по времени? Ну, то есть за минуты или за месяц?

Делитесь своим мнением в комментариях. Ну, и скоро увидимся в новых обзорах крутых ИИ-сервисов.

22
Начать дискуссию