Athene-Llama3-70B - это чат-ориентированная модель, дообученная с помощью RLHF на основе Llama-3-70B-Instruct. Значительное повышение производительности - это результат строгих оценочных показателей в процессе обучения, качественный собственный датасет и уникальный посттренинговый конвейер Nexusflow.Улучшения по сравнению с исходной Llama-3-70B-Instruct:🟢Более точное следование инструкциям, модель лучше реагирует на сложные промпты, выдавая четкие и лаконичные ответы;🟢Повышена способность в математике и рассуждениях, способность решать вопросы, требующие большого количества аргументов;🟢Улучшен навык помощи написания кода в виде расширенных предложений по коду для более легкого создания и внедрения;🟢Доработана креативность в написании текстов, писем, эссэ;🟢Улучшена поддержка мультиязычности и повышено качество семантического перевода с одного языка на другой.Athene-70B показала результат 77,8% в Arena-Hard-Auto, что ставит ее в один ряд с GPT-4o (79,2%) laude-3.5-Sonnet (79,3%).Для сравнения, базовая Llama-3-70B-Instruct в Arena-Hard-Auto демонстрировала результат в 46,6%.▶Внимание, размер модели составляет ~ 140 GbAthene-70B использует тот же шаблон системного промпта, что и Llama-3-70B-Instruct.📌Лицензирование: CC-BY-NC-4.0📌Лицензирование: CC-BY-NC-4.0🟡Страница проекта https://nexusflow.ai/blogs/athenenexusflow.aiNexusflow.ai | Blog :: Athene-70B: Redefining the Boundaries of Post-Training for Open Models🟡Модель на HF https://huggingface.co/Nexusflow/Athene-70B🖥Github Nexusflow [ Stars: 349 | Issues: 9 | Forks: 30 ] https://github.com/nexusflowai/NexusRaven-V2@ai_machinelearning_big_data#AI #Nexusflow #LLM #ML #Athene70B