Ещё раз перечитал статью и гложат вопросы.
1. Сколько времени вы потратили на подбор промптов? Это же совсем нетривиальная задача.
2. Какие модели вы используете сейчас? На чём остановились?
3. Вы обучали модели или использовали чистые/файнтюненные?
Судя по их сайту, это будут IT и около-IT специальности, HRы и SMMщики
Круто конечно вы загнули.
InternLM2 - какое-то УГ во-первых 8b не может весить 2ГБ На простое "Привет" ответила мне: "Привет! Как дела? Ваши собесельбовки напоминают ли тебя о частицах из нашего мира?" (Сис промпт был "Говори на русском языке")
OpenChat совсем уж тормозной
Yi1.5 не прошёл нашу проверку, хоть и показался сначала нормальным
Мы остановились на модели Qwen2.5 17b q8 - скорость приемлемая, качество отменное, русский язык чистый.
Хорошее сравнение возможностей российских моделей. Спасибо! Сам в сентябре гигачат тестировал для бизнес-задач. Показал он себя крайне плохо. Сейчас уже что-то. Прогресс у них всё-таки есть.
Хм... Получается что штат аналитиков можно тихонько сокращать и переходить на АИ-решения. Интересно. Спасибо за статью.
>есть дефицит квалифицированных адекватных специалистов.
Не знаю как цитату тут сделать, но вот с этим я согласен полностью.