Вышел Grok-4 – совершенная AI модель!

Только что на стриме xAI Илон Маск и команда показали Grok-4. Новая SOTA?

– На Humanity’s Last Exam Grok 4 Heavy набрал 50,7%. Это больше чем в два раза выше, чем у прошлых лидеров. Gemini 2.5 Pro набирал только 22%.

– С инструментами (tools) обычный Grok 4 даёт 41%, без инструментов — 26,9%.

– Инструменты (tool use) встроены прямо в обучение. Модель реально использует браузер, интерпретатор кода и прочие внешние сервисы.

– Стал лучше голосовой режим. Grok теперь может не только говорить, но и шептать, петь, менять интонации и эмоции.

– В чате доступны сразу две версии: обычная (для всех) и Grok Heavy (выбивает 100% на AIME 2025, RIP очередной бенчмарк 🎩).

– За Grok Heavy — 300 долларов в месяц.

– В вендинг-бенче (тут писал, как Claude обанкротился изначально став бизнесменом) Grok 4 заработал $4694 и продал больше 4500 товаров. Для сравнения: Claude Opus смог только $2077. Grok сам принимал решения, как закупать и по каким ценам продавать. Кажется, что в ближайший год большие оптимизации коснутся больших ритейлеров.

– Grok 4 уже сегодня доступен через xAI API. Контекст 256k токенов, мультимодальный reasoning, поиск по реальным данным, безопасность для бизнеса (не обучается на данных компаний).

– Grok 4 первый, кто пробил 10% на ARC-AGI v2 (там 15,9%). В ARC-AGI v1 — 66,6%. Это лучший результат среди всех LLM.

– В медицине тоже топ! На X-ray бенчмарке Grok 4 даёт 72,8%. Выше всех остальных моделей.

– Модель уже умеет собирать 3D-игры. Grok сам находит ассеты, подбирает текстуры и добавляет 3D-модели в движок.

Что дальше?

– В августе выйдет отдельная кодовая модель.

– В сентябре появится мультимодальный агент.

– В октябре будет модель для генерации видео.

Всё это будет частью Grok 4.

xAI говорят, что Grok 4 уже лучше многих PhD по всем предметам. И обещают новые технологии и даже открытия в физике в ближайшие пару лет.

Мощная заявка и кажется у нас есть новый тариф в $300, к которому скорее всего этим летом подтянутся остальные игроки.

Чтож, Сэм, пора выпускать монстра GPT-5. Заждались!

Подписывайтесь на Telegram ИИволюция 👾.

Начать дискуссию