{"id":14291,"url":"\/distributions\/14291\/click?bit=1&hash=257d5375fbb462be671b713a7a4184bd5d4f9c6ce46e0d204104db0e88eadadd","hash":"257d5375fbb462be671b713a7a4184bd5d4f9c6ce46e0d204104db0e88eadadd","title":"\u0420\u0435\u043a\u043b\u0430\u043c\u0430 \u043d\u0430 Ozon \u0434\u043b\u044f \u0442\u0435\u0445, \u043a\u0442\u043e \u043d\u0438\u0447\u0435\u0433\u043e \u0442\u0430\u043c \u043d\u0435 \u043f\u0440\u043e\u0434\u0430\u0451\u0442","buttonText":"","imageUuid":""}

Prometheus 2 - новый лучший инструмент для оценки больших языковых моделей!

Prometheus 2: Языковая модель с открытым исходным кодом, специализирующаяся на оценке других языковых моделей.

По сравнению с Prometheus 1 (13B), Prometheus 2 (8x7B) - обеспечивает более точные оценки моделей и также поддерживает оценку в формате попарного ранжирования (относительной классификации)!

На 8 бенчмарках Prometheus 2 демонстрирует наивысшую корреляцию с оценками, сделанными экспертами. Что делает модель самым мощным инструментом для оценки.

⚡ Поддерживает оценку Prometheus, GPT-4 и Claude-3 🚀 ⚡

pip install prometheus-eval

• Github: https://github.com/prometheus-eval/prometheus-eval

• Paper: arxiv.org/abs/2405.01535

В своем канале я провожу тест это и других новых моделей машинного обучения, залетайте.

0
1 комментарий
Илья Тропарев

Prometheus 2 представляет собой перспективный инструмент для оценки больших языковых моделей

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда