Grok 4.1: его можно попробовать бесплатно и он действительно лучше, чем кажется

xAI тихо, но уверенно выкатывает Grok 4.1. Казалось бы, очередное обновление очередной нейросети, но в этот раз модель действительно произвела заметный шум: впечатляющие бенчмарки, заявленное в три раза снижение галлюцинаций и новая ставка на «эмоциональный интеллект».

Попробовать Grok 4.1 и сравнить его с другими нейронками можно в SYNTX AI, где я делаю абсолютно всё, каждый божий день. ВАЖНО! По промокоду SLEZAMNEVERIT первые 50 пользователей могут получить скидку в 15% на любой тариф.

www.syntx.ai

SYNTX AI - 90+ AI-инструментов в веб и Telegram

Разберёмся, что в этом релизе технологический прогресс, а что – продуманный маркетинг, рассчитанный на тех, кто давно подозревает, что ИИ понимает его лучше, чем коллеги.

По данным EQ-Bench, новый Grok 4.1 стал лидером в категории Emotional Intelligence Benchmark, то есть, условно говоря, лучше всех притворяется, что сопереживает вам.

Если бы эмоциональный интеллект был валютой, Grok 4.1 уже торговали бы на бирже.

В Creative Writing v3 модель заняла второе место, уступив лишь Polaris Alpha, ранней версии GPT 5.1.

Отрыв от предшественника настолько большой, что можно предположить: где-то в xAI наконец-то нашли фантазию.

В интерфейсе Grok теперь доступен выбор модели вручную: Grok 4.1 отмечен как Beta, но все желающие могут включить и опробовать его бесплатно.

Режимы остались прежними:

Fast для тех, кто хочет быстро
Expert или Thinking для тех, кто хочет долго, но умнее
Heavy для тех, кто считает, что лишний серверный час никому не помешает

Интересно, что Grok 4.1 Thinking стабильно обгоняет обычную версию в бенчмарках на 10–15 баллов, небольшой бонус для любителей интеллектуального медленного огня.

xAI заявляет сокращение галлюцинаций почти втрое. В качестве подтверждения приводят цифры:было около 12 %, стало около 4.2 %.

На фоне старых моделей, где ИИ мог уверенно объяснить, почему Ньютон изобрёл электричество, это звучит как значительный прогресс.

Но важно помнить: измерение галлюцинаций, это штука тонкая и сильно зависит от методики. Так что относиться к этому стоит как к позитивной тенденции, а не как к гарантии, что модель больше никогда не перепутает Францию с Франкфуртом.

Чтобы не превращаться в бесплатную пресс-службу xAI, стоит отметить несколько моментов.

Во-первых, высокий эмоциональный интеллект не делает модель хорошей в сложном математическом или инженерном reasoning. Тут пока нет данных уровня «мы обошли всех».

Во-вторых, Creative Writing – бенчмарк субъективный. В мире, где фанфики часто популярнее оригиналов, ориентироваться на вкусы читателей – путь скользкий.

В-третьих, 4.1 всё ещё в статусе Beta. Это вежливое предупреждение, что иногда модель может вести себя как тестовая версия, с соответствующим поведением.

Grok 4.1: его можно попробовать бесплатно и он действительно лучше, чем кажется

Grok 4.1 установил рекорд по эмоциональному интеллекту

В творческих бенчмарках новый Grok тоже заметно прибавил

Новый режим Thinking и ручной выбор модели

Галлюцинаций стало меньше. В три раза. Но не забываем про нюансы

Немного трезвости: где результаты впечатляют меньше