{"id":14292,"url":"\/distributions\/14292\/click?bit=1&hash=23aed192f809013ec1c0769a11eb00fbed4dd7038bbe5f8e3db447db2e792dcd","title":"\u0421 \u043d\u0430\u0447\u0430\u043b\u0430 \u0433\u043e\u0434\u0430 \u043a\u0430\u0440\u0442\u043e\u0439 \u00ab\u0425\u0430\u043b\u0432\u0430\u00bb \u043e\u043f\u043b\u0430\u0442\u0438\u043b\u0438 40 \u043c\u043b\u043d \u043f\u043e\u043a\u0443\u043f\u043e\u043a","buttonText":"","imageUuid":""}

Prometheus 2 - новый лучший инструмент для оценки больших языковых моделей!

Prometheus 2: Языковая модель с открытым исходным кодом, специализирующаяся на оценке других языковых моделей.

По сравнению с Prometheus 1 (13B), Prometheus 2 (8x7B) - обеспечивает более точные оценки моделей и также поддерживает оценку в формате попарного ранжирования (относительной классификации)!

На 8 бенчмарках Prometheus 2 демонстрирует наивысшую корреляцию с оценками, сделанными экспертами. Что делает модель самым мощным инструментом для оценки.

⚡ Поддерживает оценку Prometheus, GPT-4 и Claude-3 🚀 ⚡

pip install prometheus-eval

• Github: https://github.com/prometheus-eval/prometheus-eval

• Paper: arxiv.org/abs/2405.01535

В своем канале я провожу тест это и других новых моделей машинного обучения, залетайте.

0
1 комментарий
Илья Тропарев

Prometheus 2 представляет собой перспективный инструмент для оценки больших языковых моделей

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда