Mlops: статьи и новости по теме

13.12.2024

Развертывание Marco o1 на локальном PC. Языковая модель рассуждений

Недавно я запускал и тестировал Marco o1. Это одна из первых опенсорсных языковых моделей с многоступенчатой логикой, эта модель использует Chain-of-Thoughts и некоторые другие алгоритмы, которые помогают с решением задач на математику, логику и кодинг. Marco-o1 названа по аналогии с OpenAI o1, благодаря которой Chain-of-Thoughts промптинг и файнтю…

Qwen 2.5 и Qwen 2.5 Coder - перспективная коллекция LLM для систем агентов

Разработчикам приложений Generative AI стоит обратить внимание на новую коллекцию моделей Qwen 2.5 и Qwen 2.5 Coder. С сентября 2024 года эти модели привлекают внимание разработчиков благодаря своей эффективности.

Роман Куцев CEO LLM Arena

11.11.2024

Руководство по масштабированию MLOps

Квантизация позволяет запускать Llama 3.2 на мобилках

Квантизация помогла портировать последнюю версию LLM Llama 3.2 на мобильные платформы - iOS и Android. Для этого разработчики выпустили квантованные версии Llama 3.2 1B и 3B, которые при тестах на ARM-процессорах показали высокую скорость инференса, по сравнению с несжатыми весами в формате BF16.

Мультимодальные приложения на Llama 3.2 и Llama Stack

Недавний релиз Llama 3.2 с мультимодальными версиями 11B и 90B открывает возможности для создания AI приложений, анализирующих визуальный ввод.

OpenAI o1 - LLM, обученная выполнять сложные логические рассуждения

OpenAI изменили направление развития своих языковых моделей, от просто генерации текста их последняя модель перешла к решению задач с использованием логики и пошагового анализа проблемы.

GlowByte

24.06.2024

Лучшим стажерам GlowByte по направлению «Практический ModelOps» предложат трудоустройство в компании

В мае текущего года практика Advanced Analytics GlowByte провела студенческую стажерскую программу по направлению «Практ��ческий ModelOps». Из 35 кандидатов, претендующих на участие, 12 человек прошли три этапа отбора. В проведении стажировки и оценке проектов принимали участие руководители и специалисты направления ModelOps.

Роман Куцев CEO LLM Arena

10.12.2022

Архитектура платформы машинного обучения в продакшене