Мини-ПК за $1700 запускает модель на 235 миллиардов параметров. Это уровень ChatGPT Pro и Claude Max
На CES 2026 в Лас-Вегасе Лиза Су, CEO AMD, вышла на сцену для кейноута. За ней на платформе стоял небольшой чёрный ящик. Не стойка с серверами, не рендер дата-центра — маленький мини-ПК размером с толстую книгу.
Кстати, подобное можешь читать в моем тг канале - там про ИИ-инструменты и не только.
Через несколько месяцев на AMD AI Developer Day в Шанхае она подошла к этому же устройству и лично его подписала.
Устройство называется GMKtec EVO-X2. Стоит $1700-2000. И запускает модели такого размера, до которых большинство облачных подписок не дотягиваются.
Чип, который изменил математику
Всё начинается с AMD Ryzen AI Max+ 395, кодовое имя Strix Halo.
Это первый x86-чип, который запускает модель на 200 миллиардов параметров на одном куске кремния — через унифицированную архитектуру памяти, похожую на Apple Silicon.
Простыми словами: вместо отдельной видеокарты со своей ограниченной памятью процессор и GPU делят один общий пул до 128 ГБ. Модель загружается один раз, и оба читают из одного места.
Характеристики EVO-X2:
- Чип: AMD Ryzen AI Max+ 395
- Ядра/потоки: 16/32
- Тактовая частота: до 5.1 ГГц
- GPU: 40 вычислительных блоков RDNA 3.5
- NPU: 50 TOPS
- Совокупная AI-производительность: 126 TOPS
- Унифицированная память: до 128 ГБ
- Используемый VRAM под Linux: до 110 ГБ
- Цена: $1700-2000
Что это реально делает
В тестах AMD заявляет, что чип обогнал NVIDIA RTX 5080 более чем в три раза на инференсе DeepSeek R1. Это мини-ПК размером с ланч-бокс против дискретной видеокарты за $1000+.
На конфигурации 128 ГБ под Linux доступно 110 ГБ VRAM. Этого хватает на:
- Qwen3-235B — работает полностью и плавно
- DeepSeek-V3 — работает комфортно
- Llama 3.3 70B — быстро, с запасом
- Qwen3.6 27B — очень быстро, подходит как основная рабочая модель
Для сравнения: запускать модели такого размера через API — это $200 в месяц. И даже на таких планах в часы пик часто стоят лимиты.
Какие подписки это заменяет
Считаем честно. Типичный тяжёлый пользователь:
- Claude Code Max (20x) — $200/мес
- ChatGPT Pro — $200/мес
- Gemini Advanced — $20/мес
- Cursor Pro — $20/мес
Итого: $440 в месяц, $5280 в год.
EVO-X2 стоит $1700-2000 один раз.
Настройка — десять минут
EVO-X2 поставляется с Windows 11, но под Linux открывается полный объём 110 ГБ VRAM против 96 ГБ на Windows.
После установки ОС — одна команда в терминале для Ollama. Ещё одна команда — и модель скачана. Через 15-20 минут локальный AI работает с интерфейсом через Open WebUI, который выглядит и ощущается как ChatGPT.
Для разработчиков: Claude Code переключается на локальную модель одной переменной окружения. Тот же интерфейс, те же команды, тот же воркфлоу — только ничего не уходит за пределы машины и каждый запрос ничего не стоит.
Честные минусы
Это не Mac Mini. Больше по размеру, горячее под нагрузкой, потребляет больше электричества.
Но разница в возможностях реальная: EVO-X2 запускает модели в 3-4 раза крупнее, чем комфортно влезает в память Mac Mini. Если нужны модели от 70B и выше локально — это та ступень, где это становится возможным без Mac Studio за $4000+.
Где облако всё ещё выигрывает: агентный кодинг на огромных кодовых базах и задачи, где важен каждый процент точности на бенчмарках. Для всего остального разрыв практически закрыт.
AMD специально построила чип, чтобы запуск 200-миллиардной модели на потребительском железе перестал звучать как фантастика. GMKtec упаковала его в коробку за $1700, CEO AMD вышла с ним на сцену и подписала его своим именем.
Облачные подписки имели смысл, пока ничто на столе не могло тягаться с облаком. Для моделей в диапазоне 70B-235B этот разрыв сейчас практически исчез — если готов сделать одну покупку вместо ежемесячного платежа.
И снова про мой тгк - там про ИИ-инструменты и смежное, часто рассказываю раньше, чем это появляется в вашей ленте!
Спасибо за прочтение!