Кейс: модуль транскрибации и суммаризации для «Актру»
Привет! Я Дмитрий Дудников, СЕО IT-компании «Иневилс». В этом кейсе расскажем, как разработали для компании «Актру» ряд AI-модулей, которые расшифровывают аудио- и видеофайлы и суммаризируют текст за несколько минут.
Кто наш клиент?
Это компания «Актру», которая развивает стартап в сфере AI.
Какую боль он захотел закрыть?
Представьте: середина рабочего дня, у вас было уже три онлайн-встречи, впереди ещё несколько. И вам нужно вспомнить какой-то важный факт, о котором говорили на первом созвоне. Чтобы найти нужные данные, приходится переслушивать запись — в среднем она длится час, если не больше. На такую, казалось бы, простую задачу уходит много времени.
Неоцифрованные звонки — враг для всех: от фрилансеров до компаний любого масштаба. Информация хранится бессистемно и быстро найти нужное невозможно. Компания «Актру», наш клиент, захотела закрыть эту боль целевой аудитории.
Какая стояла задача?
Разработать несколько AI-модулей, работающих и автономно, и комплексно, которые расшифровывают аудио- и видеофайлы и суммаризируют информацию оттуда.
Что мы сделали?
За год сотрудничества сделали целую экосистему для обработки контента.
1. Модуль транскрибации
Сперва аудио переводится в текст. Сервис расставляет временные метки для каждого слова и формирует субтитры.
2. Модуль суммаризации
Он извлекает из текста главную информацию. Специфика текстов в том, что в них очень много персональных данных. Им нужно обеспечить конфиденциальность. Поэтому модуль можно развернуть во внутреннем контуре, и он не будет отправлять информацию в облачные сервисы.
3. Модуль диаризации
Это разделение многоголосия на разные звуковые дорожки.
4. Бот-расшифровщик
Он работает на базе Telegram и транскрибирует любые видео- и аудиофайлы.
5. Интеграции
Сейчас они настроены с разными сервисами видеоконференций — Яндекс.Телемост, Zoom, Google Meet и другими. Интеграции расширяют функционал и облегчают пользователям работу с модулем.
Параллельно с разработкой внутренняя команда заказчика создавала графический интерфейс.
Мы выполняли задачи последовательно и правильно расставляли приоритеты. Благодаря этому стартап успешно запустился. Сейчас мы тоже регулярно выполняем какие-то новые задачи — например, оптимизируем модули, когда меняется версия нейросети. Планируем и дальше дорабатывать качество и скорость распознавания.
Подробнее о других кейсах — на сайте inevils.ru
Что в результате?
Мы выполняли задачи последовательно и правильно расставляли приоритеты. Благодаря этому стартап успешно запустился. Сейчас мы тоже регулярно выполняем какие-то новые задачи — например, оптимизируем модули, когда меняется версия нейросети. Планируем и дальше дорабатывать качество и скорость распознавания.