T-Pro 2.0 — русскоязычная альтернатива GPT-4? Разбираем модель от "Т-Технологии"

За последний год в open-source сообществе стали появляться сильные модели на русском языке, одна из них — T-Pro 2.0 от команды. Это LLM с 70 миллиардами параметров, построенная на архитектуре Qwen-3 и обученная на большом количестве высококачественных инструкционных данных.

T-Pro 2.0 — русскоязычная альтернатива GPT-4? Разбираем модель от "Т-Технологии"

Если кратко: модель показывает высокие результаты на сложных логических и языковых задачах, а также вводит интересную механику “гибридного мышления”. Ниже — подробно о том, что это за модель, зачем она нужна и кому может быть полезна.

Зачем нужна ещё одна LLM на 70B параметров?

Многие крупные LLM в open-source ориентированы либо на англоязычные данные, либо на скорость, либо на «универсальность». T-Pro 2.0, напротив, делает ставку на:

  • Логические рассуждения,
  • Инструкционное поведение,
  • Русскоязычные кейсы.

По сути, модель адаптирована и обучена специально под задачи, где важны последовательные размышления, контекст и правильная структура ответа.

Что под капотом

Модель T-Pro 2.0 построена на архитектуре Qwen-3 с 70 миллиардами параметров и была кастомно дообучена под русскоязычные задачи. В процессе обучения команда "Т-Технологии" использовала около 40 миллиардов токенов инструкционных диалогов, уделив особое внимание задачам на логическое рассуждение. Примерно полмиллиона таких задач было включено в тренировочный датасет, а также около 100 тысяч примеров, ориентированных на настройку модели под человеческие предпочтения.

Сравнение от Т-Технологии
Сравнение от Т-Технологии

T-Pro 2.0 сочетает лучшее качество среди открытых моделей в размере 30 миллиардов параметров с практичностью при внедрении — более быстрая генерация рассуждений на любом кириллическом языке дает в среднем двукратную экономию вычислительных ресурсов по сравнению с доступными аналогами. Мы продолжаем делиться своими лучшими разработками с индустрией — под лицензией Apache 2.0 каждая компания может свободно переиспользовать наши вложенные усилия и опыт, дообучить модель на своих данных, создать собственные решения

Виктор Тарнавский, директор по искусственному интеллекту Т-Банка

Где можно протестировать

T-Pro 2.0 уже доступна на HuggingFace, а также в виде FP8-версии — T-pro-it-2.0-FP8.

Кроме того, теперь модель появилась в интерфейсе Polza AI — это платформа, объединяющая сотни языковых моделей с единым API.
В Polza доступна как обычная версия, так и FP8-вариант — можно попробовать оба режима мышления и посмотреть, как модель справляется с вашими кейсами.

Если вы работаете с ИИ в бизнесе, строите стартап или просто хотите поэкспериментировать с одним из самых продвинутых русскоязычных моделей - T Pro 2.0 достойна внимания.

7
2 комментария