{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

Стартап Speechmatics привлек $62 млн на ИИ-инструмент для преобразования речи в текст

Image credit: Speechmatics

Британский стартап Speechmatics разрабатывает ИИ-инструмент для преобразования речи в текст. Технология отличается умением распознавать акценты и диалекты, а также понимает людей с нарушениями речи. На днях компания объявила о привлечении 62 миллионов долларов в ходе раунда финансирования серии B. Средства пойдут на дальнейшее развитие продукта.

Возглавила раунд инвестиционная компания Susquehanna Growth Equity из США, также в нём приняли участие британские инвесторы AlbionVC и IQ Capital.

Компания Speechmatics была основана в 2006 году на основе исследований в области ИИ доктора Кембриджского университета Тони Робинсона. До нынешнего раунда компании удалось привлечь общей сложностью около 10 миллионов долларов.

Созданный стартапом продукт на данный момент способен распознавать речь и преобразовывать её в текст на 34 языках, в том числе и на русском. Благодаря новому финансированию, компания планирует обучить инструмент новым языкам, а также расширить возможности технологии - например, научить ИИ воспринимать речь, записанную на фоне сильного шума вроде оживленной автомобильной дороги. Движок уже сейчас умеет распознавать различные акценты упомянутых 34 языков, а также понимает проблемную речь с заиканиями или шепелявостью.

Image credit: Speechmatics

Speechmatics предлагает инструмент в качестве API корпоративным клиентам в формате B2B. За время существования у стартапа набралась клиентская база из примерно 170 компаний - в частности, технология использовалась в проектах по расшифровке аудиозаписей, озвучке навигаторов, автоматическом генерировании субтитров и других задач в связке речь-текст.

По словам генерального директора стартапа Кэти Вигдаль, для обучения инструмента разработчикам пришлось собирать данные в виде миллионов часов аудиозаписей человеческой речи. Конечной целью развития технологии она называет возможность преобразовать речь любого человека.

Первоначально стартап давал доступ к своей технологии только через частный API. Сейчас компания предоставляет разработчикам возможность поработать с технологией через более открытые инструменты API, а также разместить пробную версию инструмента на корпоративных сайтах.

По словам Вигдаль, Speechmatics приходится конкурировать с аналогичными инструментами преобразования речи от крупных компаний и корпораций вроде Amazon, Google и Microsoft. Однако, по её словам, технология стартапа имеет преимущество в распознавании тонкостей речи: в частности, исследование Стэнфордского университета выявило, что при распознавании афроамериканских диалектов и акцентов инструмент Speechmatics показал точность 82,8%, по сравнению с 68,6% у Google и таким же показателем у Amazon. Отчасти именно результаты подобных исследований стали причиной заинтересованности инвесторов в финансировании данной компании.

Если вам понравилась статья, поделитесь ею в своем блоге или поставьте нам оценку, чтобы о проекте узнало как можно больше читателей!

0
Комментарии
-3 комментариев
Раскрывать всегда