Запуск OpenAI GPT-OSS моделей на AMD: революция в локальном ИИ

Развитие технологий искусственного интеллекта происходит стремительными темпами, и специалисты индустрии стремятся быть в курсе всех новинок. На портале G-PU.ru регулярно публикуются актуальные материалы о современных решениях в сфере графических процессоров и ИИ-вычислений, помогая энтузиастам и профессионалам разобраться в быстро меняющемся ландшафте технологий. Сегодня мы рассмотрим одно из самых значимых событий августа 2025 года — выпуск первых открытых языковых моделей от OpenAI и их поддержку на процессорах AMD.

Прорыв в открытых языковых моделях

OpenAI совершила настоящий переворот, опубликовав свои первые открытые языковые модели GPT-OSS. Эти решения включают две ключевые модели: GPT-OSS 120B с 116,8 миллиардами параметров и 5,1 миллиардами активных параметров, а также GPT-OSS 20B с 20,9 миллиардами параметров и 3,6 миллиардами активных параметров.

Главная особенность этих моделей заключается в их архитектуре mixture-of-experts (смесь экспертов), которая обеспечивает высокую производительность при относительно небольшом количестве активных параметров. Это позволяет запускать мощные ИИ-модели на потребительском оборудовании, что ранее было доступно только на серверном железе.

AMD лидирует в поддержке новых технологий

Компания AMD продемонстрировала готовность к поддержке новых моделей OpenAI с первого дня релиза. AMD Ryzen AI Max+ 395 стал первым в мире потребительским AI-процессором, способным запускать модель GPT-OSS 120B. Это достижение подчеркивает лидерство AMD как единственного поставщика полноценных решений от облачных до клиентских AI-задач.

Процессор Ryzen AI Max+ 395 с 128 ГБ памяти способен обрабатывать до 128 миллиардов параметров в операционной системе Windows через llama.cpp. При работе с моделью GPT-OSS 120B достигается скорость до 30 токенов в секунду, что обеспечивает комфортную работу пользователей благодаря высокой пропускной способности платформы Ryzen AI Max+.

Оптимальные конфигурации для разных задач

Для пользователей процессоров AMD Ryzen AI 300 серии рекомендуется использовать модель GPT-OSS 20B, которая полностью раскрывает потенциал данной платформы. Владельцы настольных систем могут значительно повысить производительность, используя видеокарту AMD Radeon 9070 XT 16GB, которая обеспечивает молниеносную скорость генерации токенов и превосходное время до первого токена (TTFT).

Особенно важно отметить поддержку Model Context Protocol (MCP), которая доступна на системах с большим объемом памяти. Это открывает новые возможности для создания сложных AI-приложений с расширенным контекстом.

Практическое руководство по настройке

Для успешного запуска моделей необходимо выполнить несколько простых шагов:

Подготовка системы:

Установить драйверы AMD Software: Adrenalin Edition версии 25.8.1 WHQL или новее

На системах с Ryzen AI настроить Variable Graphics Memory согласно спецификациям

Загрузить и установить LM Studio — основной инструмент для работы с моделями

Настройка модели:

В разделе "Discover" найти модели с префиксом "lm studio community"

Выбрать соответствующую модель (20B или 120B) и загрузить её

В настройках чата установить максимальное значение "GPU Offload"

Активировать ручную загрузку параметров для оптимальной производительности

Важно учитывать, что загрузка модели GPT-OSS 120B может занять значительное время из-за её размера, а индикатор прогресса может временно останавливаться — это нормальное поведение при работе с большими моделями.

Технические характеристики и производительность

Тестирование проводилось на актуальных конфигурациях: ASUS ROG Flow Z13 с процессором Ryzen AI MAX+ 395, 128 ГБ памяти DDR5-8000 и операционной системой Windows 11 Pro 24H2. Для настольных систем использовалась видеокарта Radeon RX 9070 XT 16GB в связке с Intel Core i9-13900K и 32 ГБ памяти DDR5-6000.

Результаты демонстрируют впечатляющую производительность локального ИИ-вывода, сопоставимую с облачными решениями. Это открывает новые горизонты для разработчиков и исследователей, желающих работать с передовыми языковыми моделями без зависимости от интернет-соединения и внешних сервисов.

Появление открытых моделей GPT-OSS и их нативная поддержка на оборудовании AMD знаменует новую эру в развитии доступного искусственного интеллекта, делая передовые технологии доступными широкому кругу пользователей.

Подписывайтесь на нас:

https://vk.com/g_pu_ru;

https://dzen.ru/gpu_arenda;

https://t.me/g_pu_ru;

https://vc.ru/u/3770151-arenda-gpu-serverov-videokart