{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

Стартап AssemblyAI, разрабатывающий API для расшифровки речи, привлек $28 млн

Image credit: AssemblyAI

Стартап AssemblyAI, разрабатывающий решение для анализа и расшифровки речи, объявил о привлечении 28 миллионов долларов в ходе раунда финансирования серии А. Ведущим инвестором раунда стала компания Accel, также в нем приняли участие бизнес-инкубатор Y Combinator и несколько предпринимателей из США и Ирландии.

Компания из Сан-Франциско разрабатывает API для работы с речью, записанной в аудиоформате. Сервис может помочь расшифровать записанную речь, найти в ней конкретные слова, сформировать краткое содержание сказанного. От многих других аналогичных продуктов AssemblyAI отличает простой процесс интеграции в приложения или корпоративные системы.

Стартап предлагает несколько различных API-интерфейсов, которые запускаются с помощью пары строчек кода. Инструменту можно давать команды вроде «проверь этот подкаст на наличие запрещенного контента», «идентифицируй спикеров в этом аудио», или «обобщи эту запись в менее чем 100 словах».

Цена за услуги сервиса рассчитывается в зависимости от длительности аудио, которое нужно расшифровать клиенту. По информации с сайта стартапа, расшифровка аудио стоит $0,00025 за секунду, а задачи вроде анализа, реферирования или модерации контента обойдутся в $0,000167 за секунду. Для новых пользователей есть возможность поработать с бесплатной пробной версией.

Image credit: AssemblyAI

Обработка аудиофайла через инструмент AssemblyAI занимает примерно 25% времени от длительности аудио - например, 20-минутная запись будет обрабатываться около 5 минут. На данный момент сервис умеет работать с речью на английском языке, включая все его виды акцентов. В 2022 году компания планирует внедрить расшифровку на 35 языках (каких именно - не сообщается).

Как указано на сайте проекта, его клиентами уже успели стать более тысячи компаний от небольших стартапов до крупных корпораций, а число аудиозаписей, которые ежедневно расшифровываются с помощью API AssemblyAI, превышает 1 миллион.

По словам основателя и генерального директора стартапа Дилана Фокса, в ближайшее время компания планирует вкладывать полученные инвестиции в дальнейшее обучение своей технологии, а также исследования и разработки в области распознавания человеческой речи технологиями искусственного интеллекта. Также стартап планирует привлечь в свою команду новых ИИ-инженеров и исследователей для работы над созданием инновационных продуктов.

Если вам понравилась статья, поделитесь ею в своем блоге или поставьте нам оценку, чтобы о проекте узнало как можно больше читателей!

0
Комментарии
-3 комментариев
Раскрывать всегда