Thinking Machines бывшего техдиректора OpenAI Миры Мурати впервые анонсировала свою разработку — «модели взаимодействия»
Полноценный релиз обещают в 2026 году.
Нейросеть одновременно синтезирует ответ в аудиоформате и визуализирует данные. Источник: Thinking Machines Lab
- Стартап представил ИИ-технологию TML-Interaction, которую назвал не языковой моделью, а «моделью взаимодействия».
- Большинство современных голосовых помощников сначала обрабатывают запрос, потом генерируют ответ, поэтому путаются, когда их перебивают, и могут отвечать с задержкой, объясняет компания.
- TML-Interaction общается с пользователем и обрабатывает информацию «так же, как это делают люди»: непрерывно воспринимает аудио, видео и текст, параллельно «рассуждает» и реагирует в режиме реального времени.
- Модель может искать по интернету или генерировать интерфейсы и изображения, пока слушает пользователя. Она также «понимает», когда человек ждёт ответа, а когда просто прервался или задумался, заявляет стартап.
Голосовой помощник не начинает отвечать, когда тестировщик прерывается выпить воды, и считает животных, одновременно слушая монолог. Источник: Thinking Machines Lab
TML-Interaction попросили указывать, когда девушка горбится. Источник: Thinking Machines Lab
- Модели, которые одновременно обрабатывают входные данные и генерируют ответ, называют полнодуплексными. Такая нейросеть есть, например, у Nvidia, но, в отличие от TML-Interaction, она не работает с видео.
- Thinking Machines Lab заявляет, что обучила свою модель с нуля. У TML-Interaction-Small 276 млрд параметров, из них 12 млрд активных, она отвечает с задержкой в 0,4 секунды.
- В ближайшие несколько месяцев компания собирается открыть к ней доступ в режиме исследовательского превью. В течение 2026 года обещают выпустить модель в открытый доступ и добавить версии с большим числом параметров.
- 7 мая 2026 года OpenAI выпустила «рассуждающие» аудиомодели семейства GPT‑Realtime‑2. Компания заявляет, что они тоже реагируют на перебивания в режиме реального времени, но полнодуплексными их не называет.
10 комментариев