Кейс: модуль транскрибации и суммаризации для «Актру»

Привет! Я Дмитрий Дудников, СЕО IT-компании «Иневилс». В этом кейсе расскажем, как разработали для компании «Актру» ряд AI-модулей, которые расшифровывают аудио- и видеофайлы и суммаризируют текст за несколько минут.

Кейс: модуль транскрибации и суммаризации для «Актру»

Кто наш клиент?

Это компания «Актру», которая развивает стартап в сфере AI.

Какую боль он захотел закрыть?

Представьте: середина рабочего дня, у вас было уже три онлайн-встречи, впереди ещё несколько. И вам нужно вспомнить какой-то важный факт, о котором говорили на первом созвоне. Чтобы найти нужные данные, приходится переслушивать запись — в среднем она длится час, если не больше. На такую, казалось бы, простую задачу уходит много времени.

Неоцифрованные звонки — враг для всех: от фрилансеров до компаний любого масштаба. Информация хранится бессистемно и быстро найти нужное невозможно. Компания «Актру», наш клиент, захотела закрыть эту боль целевой аудитории.

Какая стояла задача?

Разработать несколько AI-модулей, работающих и автономно, и комплексно, которые расшифровывают аудио- и видеофайлы и суммаризируют информацию оттуда.

Что мы сделали?

За год сотрудничества сделали целую экосистему для обработки контента.

1. Модуль транскрибации

Сперва аудио переводится в текст. Сервис расставляет временные метки для каждого слова и формирует субтитры.

2. Модуль суммаризации

Он извлекает из текста главную информацию. Специфика текстов в том, что в них очень много персональных данных. Им нужно обеспечить конфиденциальность. Поэтому модуль можно развернуть во внутреннем контуре, и он не будет отправлять информацию в облачные сервисы.

3. Модуль диаризации

Это разделение многоголосия на разные звуковые дорожки.

4. Бот-расшифровщик

Он работает на базе Telegram и транскрибирует любые видео- и аудиофайлы.

5. Интеграции

Сейчас они настроены с разными сервисами видеоконференций — Яндекс.Телемост, Zoom, Google Meet и другими. Интеграции расширяют функционал и облегчают пользователям работу с модулем.

Параллельно с разработкой внутренняя команда заказчика создавала графический интерфейс.

Мы выполняли задачи последовательно и правильно расставляли приоритеты. Благодаря этому стартап успешно запустился. Сейчас мы тоже регулярно выполняем какие-то новые задачи — например, оптимизируем модули, когда меняется версия нейросети. Планируем и дальше дорабатывать качество и скорость распознавания.

Подробнее о других кейсах — на сайте inevils.ru

Что в результате?

Мы выполняли задачи последовательно и правильно расставляли приоритеты. Благодаря этому стартап успешно запустился. Сейчас мы тоже регулярно выполняем какие-то новые задачи — например, оптимизируем модули, когда меняется версия нейросети. Планируем и дальше дорабатывать качество и скорость распознавания.

Начать дискуссию