Опыт голосового режима в ChatGPT: год и четыре дня

В 2023 году я писал в своём блоге: "Я раньше не использовал голосовых помощников. Они мне казались глупыми и скучными. Но сейчас чувствую, что происходит какая-то трансформация взаимодействия с интерфейсами голосом.".

Прошёл год - могу заявить, что трансформация произошла.

В октябре 2023 я только начинал экспериментировать с голосовым управлением, а сегодня уже не представляю взаимодействие с интерфейсами без этого элемента. Самым значимым открытием для меня стал Advanced Voice Mode в ChatGPT, представленный в мае, которым я пользуюсь последние 4 дня. Теперь это полноценный голосовой ассистент, близкий к тому, что мы видели в фильмах вроде "Her".

Опыт голосового режима в ChatGPT: год и четыре дня

Вот несколько ключевых выводов на сегодня:

1. Изучение иностранных языков

Голосовые ассистенты меняют то, как мы учим иностранные языки. Всё дело в том, что они позволяют сразу начать использовать язык - достаточно знать базовые слова.

Я часто прошу ChatGPT варьировать интонации, менять скорость речи и быть более инициативным в диалогах, что приближает его к общению с реальным человеком. А ещё - варьировать американский/британский/индийский английский. + менять сами голоса, чтобы не привыкать.

Уникальная функция — исправление ошибок в режиме реального времени с последующим продолжением диалога — делает процесс обучения максимально естественным, как с репетитором. Это не просто упражнение на грамматику, а полноценная языковая практика с мгновенной обратной связью.

2. Voice-to-text — лучший инструмент для задач

Голосовой ввод стал моим основным методом взаимодействия для постановки задач. Надиктовать проблему или запрос голосом намного быстрее, чем печатать, а на выходе всегда удобно получить текст.

Такой формат идеально подходит для обсуждения сложных вопросов, требующих детального раскрытия.

3. Направления развития пока неясны

Хотя голосовые интерфейсы прогрессируют, мне сложно предсказать их дальнейшее развитие. Например, я рассматривал использование ассистентов для медитаций, и хотя технология продвинулась, она всё ещё не готова к самостоятельным полноценным сессиям без постоянных запросов на обратную связь. Это сбивает фокус, хотя как MVP решение уже работает неплохо.

4. Внимание в голосовом диалоге

Ещё один важный инсайт — голосовые интерфейсы способствуют лучшей концентрации. Во время текстовой переписки легко отвлекаться на другие задачи, но в голосовом формате диалог требует полного вовлечения. Это способствует более глубокой проработке вопросов и развитию идей.

5. Ручное письмо всё ещё в игре

Несмотря на все плюсы голосовых ассистентов, для заметок и постов я продолжаю использовать традиционные инструменты — клавиатуру и ручку.

Голосовой ввод — отличное дополнение, но разные задачи требуют разных методов работы с информацией. Сейчас я тестирую новый подход: обсуждение тем с голосовым ассистентом, подведение итогов диалога и последующее вручную добавление заметок в базу знаний.

Мне нравится куда это всё развивается и, надеюсь, вернусь с апдейтом через год. Там, наверное, будут уже очки, VR, AR и прочие прелести будущего 🙂

Если вам интересно читать про управление знаниями и собой - я веду телеграм-канал. Буду рад вас там видеть.

Мои посты на тему:

22
Начать дискуссию