Grok 4.1: его можно попробовать бесплатно и он действительно лучше, чем кажется

Grok 4.1: его можно попробовать бесплатно и он действительно лучше, чем кажется

xAI тихо, но уверенно выкатывает Grok 4.1. Казалось бы, очередное обновление очередной нейросети, но в этот раз модель действительно произвела заметный шум: впечатляющие бенчмарки, заявленное в три раза снижение галлюцинаций и новая ставка на «эмоциональный интеллект».

Попробовать Grok 4.1 и сравнить его с другими нейронками можно в SYNTX AI, где я делаю абсолютно всё, каждый божий день. ВАЖНО! По промокоду SLEZAMNEVERIT первые 50 пользователей могут получить скидку в 15% на любой тариф.

Разберёмся, что в этом релизе технологический прогресс, а что – продуманный маркетинг, рассчитанный на тех, кто давно подозревает, что ИИ понимает его лучше, чем коллеги.

Grok 4.1 установил рекорд по эмоциональному интеллекту

По данным EQ-Bench, новый Grok 4.1 стал лидером в категории Emotional Intelligence Benchmark, то есть, условно говоря, лучше всех притворяется, что сопереживает вам.

Таблица выглядит убедительно EQ-BENCH
Таблица выглядит убедительно EQ-BENCH

Если бы эмоциональный интеллект был валютой, Grok 4.1 уже торговали бы на бирже.

В творческих бенчмарках новый Grok тоже заметно прибавил

В Creative Writing v3 модель заняла второе место, уступив лишь Polaris Alpha, ранней версии GPT 5.1.

Grok 4.1: его можно попробовать бесплатно и он действительно лучше, чем кажется

Отрыв от предшественника настолько большой, что можно предположить: где-то в xAI наконец-то нашли фантазию.

Новый режим Thinking и ручной выбор модели

В интерфейсе Grok теперь доступен выбор модели вручную: Grok 4.1 отмечен как Beta, но все желающие могут включить и опробовать его бесплатно.

Режимы остались прежними:

  • Fast для тех, кто хочет быстро
  • Expert или Thinking для тех, кто хочет долго, но умнее
  • Heavy для тех, кто считает, что лишний серверный час никому не помешает

Интересно, что Grok 4.1 Thinking стабильно обгоняет обычную версию в бенчмарках на 10–15 баллов, небольшой бонус для любителей интеллектуального медленного огня.

Галлюцинаций стало меньше. В три раза. Но не забываем про нюансы

xAI заявляет сокращение галлюцинаций почти втрое. В качестве подтверждения приводят цифры:было около 12 %, стало около 4.2 %.

На фоне старых моделей, где ИИ мог уверенно объяснить, почему Ньютон изобрёл электричество, это звучит как значительный прогресс.

Но важно помнить: измерение галлюцинаций, это штука тонкая и сильно зависит от методики. Так что относиться к этому стоит как к позитивной тенденции, а не как к гарантии, что модель больше никогда не перепутает Францию с Франкфуртом.

Немного трезвости: где результаты впечатляют меньше

Чтобы не превращаться в бесплатную пресс-службу xAI, стоит отметить несколько моментов.

Во-первых, высокий эмоциональный интеллект не делает модель хорошей в сложном математическом или инженерном reasoning. Тут пока нет данных уровня «мы обошли всех».

Во-вторых, Creative Writing – бенчмарк субъективный. В мире, где фанфики часто популярнее оригиналов, ориентироваться на вкусы читателей – путь скользкий.

В-третьих, 4.1 всё ещё в статусе Beta. Это вежливое предупреждение, что иногда модель может вести себя как тестовая версия, с соответствующим поведением.

7
1
2 комментария