{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Искусственный интеллект в логопедии

Нейросети и искусственный интеллект уже давно перестали быть диковинкой для простого обывателя. Каждый интернет-пользователь может бесплатно попробовать сгенерировать что-то с помощью нашумевших генеративных сетей. Сегодня я расскажу вам об использовании искусственного интеллекта при работе с голосом и речью: изменение, коррекция и трансформация.

Как искусственный интеллект работает с голосом

Чаще всего искусственный интеллект (ИИ) трансформирует голос пользователя одним из следующих способов:

1) Клонирование голоса.

Этот способ — как раз то, чего боятся технофобы и противники искусственного интеллекта. ИИ клонирует ваш голос, чтобы создать его цифровую копию. Так, можно «сказать» то, чего вы никогда не говорили. Это может быть полезно при работе с озвучкой, аудиокнигами и другим контентом.

2) Модуляция голоса.

ИИ может изменять высоту, скорость и тональность голоса, чтобы он звучал по-другому. Такой подход используется при маскировке голоса, создании разных голосов, например, для персонажей или настройке тона голоса человека в соответствии с различными ситуациями.

3) Распознавание голоса.

ИИ может распознавать ваш голос и использовать его для аутентификации вашей личности. Распознавание голоса уже активно применяется в целях безопасности, как, например, и распознавание по биометрическим данным.

4) Синтез речи.

ИИ может с нуля создавать реалистично звучащую речь на основе текста, анализируя структуру языка и синтезируя речь с помощью нейронных сетей. Так создаются голосовые помощники, чат-боты и другие диалоговые интерфейсы.

5) Голосовой перевод.

ИИ способен переводить сказанное пользователем на другие языки в режиме реального времени.

Assistive Tech: может ли ИИ помочь людям с нарушениями речи

Логопедия — это область, которая традиционно полагается на людей-терапевтов, которые помогают людям с нарушениями речи.

Статистика по нарушениям речи и произношения, собранная командой Verbo

Сегодня инструменты распознавания и анализа речи на основе ИИ могут выявлять закономерности и ошибки в речи пользователя и предоставлять качественную персонализированную обратную связь и рекомендации. Такие решения затрагивают произношение, артикуляцию и общие навыки общения.

Как и терапевты, приложения и программы на основе ИИ могут подбирать целевые упражнения и действия, выполняя которые юзер сможет работать над своим произношением.

Кроме того, ИИ можно использовать для разработки вспомогательных технологий для людей с нарушениями речи, таких как системы преобразования текста в речь и голосовые устройства, которые позволяют им общаться более эффективно.

Пока речи о полной замене специалистов-логопедов технологиями не идет, они особенно эффективны в комбинации с традиционными методами.

Потенциальные сложности при использовании ИИ для коррекции речи

Использование ИИ при работе с нарушениями речи привносит большое число потенциальных преимуществ. Тем не менее, опасения по поводу потенциальных недостатков тоже имеют место быть:

1) Недостаток живого взаимодействия.

Несмотря на обратную связь и руководство, ИИ не может заменить межличностное взаимодействие и эмпатию, которые способны дать специалисты. Этот аспект приобретает особую важность для людей, которым требуется поддержка или мотивация для преодоления проблем с речью.

2) Предубеждения и ошибки.

В целом, когда мы говорим об использовании нейронных сетей и машинного обучения, всегда всплывает вопрос качества и достаточности данных для обучения моделей. Системы на основе ИИ могут быть подвержены ошибкам, особенно если они недостаточно обучены или не проверены должным образом. Это может привести к неточной обратной связи или рекомендациям, которые могут навредить развитию речи человека.

3) Доступность.

Этот момент актуален для тех, кто не имеет доступа к высокоскоростному интернету и другим технологиям, которые обеспечивают комфортную работу с решениями на основе ИИ.

4) Стоимость.

Некоторые программы или приложения в области логопедии на основе ИИ могут работать через подписку или покупку, что может стать препятствием для людей, которые не могут себе этого позволить (или же не готовы платить).

Verbo: что это

Да, это была большая подводка к решению, о котором я хочу вам рассказать. Мы с командой создаем ИИ-логопеда в смартфоне. Иными словами, нейросеть в режиме реального времени работает с естественным языком и корректирует дефекты речи.

Что уже может наша нейросеть:

1) Избавляет речь от междометий и некоторых слов-паразитов.

2) Вычищает мат.

3) Удаляет длительные паузы.

Основной упор — логопедия. Кроме того, мы видим возможное применение нашего решения в колл-центрах как способ улучшения качества обслуживания и повышения конверсии.

Пока продукт бесплатный и работает просто: записываете голосовое боту и на выходе получаете обработанную речь. Больше информации и анонсы в нашем Telegram-канале.

0
2 комментария
Alex Braytsev

Вроде идея крутая, но видимо статью плохо написали) Странно что почти нет комментариев и лайкосиков)

Ответить
Развернуть ветку
Валентин Потапов

Можете в реальном времени контролировать корректность ударений при чтении канонических текстов на церковно-славянском языке ?

Ответить
Развернуть ветку
-1 комментариев
Раскрывать всегда