Grok 4.1: его можно попробовать бесплатно и он действительно лучше, чем кажется
xAI тихо, но уверенно выкатывает Grok 4.1. Казалось бы, очередное обновление очередной нейросети, но в этот раз модель действительно произвела заметный шум: впечатляющие бенчмарки, заявленное в три раза снижение галлюцинаций и новая ставка на «эмоциональный интеллект».
Попробовать Grok 4.1 и сравнить его с другими нейронками можно в SYNTX AI, где я делаю абсолютно всё, каждый божий день. ВАЖНО! По промокоду SLEZAMNEVERIT первые 50 пользователей могут получить скидку в 15% на любой тариф.
Разберёмся, что в этом релизе технологический прогресс, а что – продуманный маркетинг, рассчитанный на тех, кто давно подозревает, что ИИ понимает его лучше, чем коллеги.
Grok 4.1 установил рекорд по эмоциональному интеллекту
По данным EQ-Bench, новый Grok 4.1 стал лидером в категории Emotional Intelligence Benchmark, то есть, условно говоря, лучше всех притворяется, что сопереживает вам.
Если бы эмоциональный интеллект был валютой, Grok 4.1 уже торговали бы на бирже.
В творческих бенчмарках новый Grok тоже заметно прибавил
В Creative Writing v3 модель заняла второе место, уступив лишь Polaris Alpha, ранней версии GPT 5.1.
Отрыв от предшественника настолько большой, что можно предположить: где-то в xAI наконец-то нашли фантазию.
Новый режим Thinking и ручной выбор модели
В интерфейсе Grok теперь доступен выбор модели вручную: Grok 4.1 отмечен как Beta, но все желающие могут включить и опробовать его бесплатно.
Режимы остались прежними:
- Fast для тех, кто хочет быстро
- Expert или Thinking для тех, кто хочет долго, но умнее
- Heavy для тех, кто считает, что лишний серверный час никому не помешает
Интересно, что Grok 4.1 Thinking стабильно обгоняет обычную версию в бенчмарках на 10–15 баллов, небольшой бонус для любителей интеллектуального медленного огня.
Галлюцинаций стало меньше. В три раза. Но не забываем про нюансы
xAI заявляет сокращение галлюцинаций почти втрое. В качестве подтверждения приводят цифры:было около 12 %, стало около 4.2 %.
На фоне старых моделей, где ИИ мог уверенно объяснить, почему Ньютон изобрёл электричество, это звучит как значительный прогресс.
Но важно помнить: измерение галлюцинаций, это штука тонкая и сильно зависит от методики. Так что относиться к этому стоит как к позитивной тенденции, а не как к гарантии, что модель больше никогда не перепутает Францию с Франкфуртом.
Немного трезвости: где результаты впечатляют меньше
Чтобы не превращаться в бесплатную пресс-службу xAI, стоит отметить несколько моментов.
Во-первых, высокий эмоциональный интеллект не делает модель хорошей в сложном математическом или инженерном reasoning. Тут пока нет данных уровня «мы обошли всех».
Во-вторых, Creative Writing – бенчмарк субъективный. В мире, где фанфики часто популярнее оригиналов, ориентироваться на вкусы читателей – путь скользкий.
В-третьих, 4.1 всё ещё в статусе Beta. Это вежливое предупреждение, что иногда модель может вести себя как тестовая версия, с соответствующим поведением.