Квантизация позволяет запускать Llama 3.2 на мобилках

Квантизация помогла портировать последнюю версию LLM Llama 3.2 на мобильные платформы - iOS и Android. Для этого разработчики выпустили квантованные версии Llama 3.2 1B и 3B, которые при тестах на ARM-процессорах показали высокую скорость инференса, по сравнению с несжатыми весами в формате BF16.

Мультимодальные приложения на Llama 3.2 и Llama Stack

Недавний релиз Llama 3.2 с мультимодальными версиями 11B и 90B открывает возможности для создания AI приложений, анализирующих визуальный ввод.

OpenAI o1 - LLM, обученная выполнять сложные логические рассуждения

OpenAI изменили направление развития своих языковых моделей, от просто генерации текста их последняя модель перешла к решению задач с использованием логики и пошагового анализа проблемы.

11

Лучшим стажерам GlowByte по направлению «Практический ModelOps» предложат трудоустройство в компании

Лучшим стажерам GlowByte по направлению «Практический ModelOps» предложат трудоустройство в компании

В мае текущего года практика Advanced Analytics GlowByte провела студенческую стажерскую программу по направлению «Практический ModelOps». Из 35 кандидатов, претендующих на участие, 12 человек прошли три этапа отбора. В проведении стажировки и оценке проектов принимали участие руководители и специалисты направления ModelOps.

Архитектура платформы машинного обучения в продакшене

Архитектура платформы машинного обучения в продакшене

Руководство по масштабированию MLOps

Руководство по масштабированию MLOps