«Т-Технологии» выпустили модель T-Pro 2.0 с гибридным режимом рассуждений

Доступна бесплатно.

  • Модель открытая и создана на базе Qwen3 на 32 млрд параметров— скачать код можно на платформе Hugging Face.
  • Гибридные модели позволяют выбирать между быстрыми ответами и «углублённым» изучением информации. Они лучше справляются со сложными аналитическими задачами и могут выполнять их без присутствия человека.
  • По сравнению с T-Pro модель научилась решать сложные задачи, планировать свои действия, выдвигать гипотезы и опровергать их.
  • Например, модели прошлого поколения можно дать задачу, на которую у человека в среднем уходит 30 секунд, а моделям с гибридным режимом рассуждений — те, на которые уходит в среднем восемь минут.
  • Также в компании отмечают, что для работы их модели потребуется вдвое меньше вычислительных мощностей, чем для китайских аналогов Qwen3 и DeepSeek R1-Distil. Экономии удалось достичь за счёт более плотной токенизации (разбивки текста на токены — vc.ru) на русском языке.
  • Суммарные затраты на разработку модели, включая расходы на вычислительные мощности для R&D (исследований и разработок) и финального дообучения, а также зарплаты сотрудников, составили менее 120 млн рублей.
12
2
1
41 комментарий