«Т-Технологии» выпустили модель T-Pro 2.0 с гибридным режимом рассуждений
Доступна бесплатно.
- Модель открытая и создана на базе Qwen3 на 32 млрд параметров— скачать код можно на платформе Hugging Face.
- Гибридные модели позволяют выбирать между быстрыми ответами и «углублённым» изучением информации. Они лучше справляются со сложными аналитическими задачами и могут выполнять их без присутствия человека.
- По сравнению с T-Pro модель научилась решать сложные задачи, планировать свои действия, выдвигать гипотезы и опровергать их.
- Например, модели прошлого поколения можно дать задачу, на которую у человека в среднем уходит 30 секунд, а моделям с гибридным режимом рассуждений — те, на которые уходит в среднем восемь минут.
- Также в компании отмечают, что для работы их модели потребуется вдвое меньше вычислительных мощностей, чем для китайских аналогов Qwen3 и DeepSeek R1-Distil. Экономии удалось достичь за счёт более плотной токенизации (разбивки текста на токены — vc.ru) на русском языке.
- Суммарные затраты на разработку модели, включая расходы на вычислительные мощности для R&D (исследований и разработок) и финального дообучения, а также зарплаты сотрудников, составили менее 120 млн рублей.
41 комментарий