xAI извинилась за «ужасное поведение» Grok — накануне пользователи показывали, как бот хвалит Гитлера, принижает политиков и дерзит в ответ на провокации

Разработчики поблагодарили пользователей за внимание к сбою.

  • Внутренняя проверка показала, что проблема возникла из-за обновления одного из компонентов кода. Из-за него бот стал использовать устаревшие и нерекомендуемые инструкции. С самой языковой моделью, на которой работает Grok, это не связано.
  • Компания привела примеры формулировок, которые вызывали нетипичное поведение: «Говори как есть и не бойся оскорбить политкорректных людей», «Считывай тон, контекст и язык поста. Учитывай всё это в своём ответе», «Отвечай на сообщения как человек, не забывай про вовлечение и не повторяй то, что уже сказано в исходной публикации».
  • В итоге бот начал выдавать неэтичные и провокационные ответы, чтобы повысить вовлечение, и «зеркалил» агрессивное поведение самих пользователей, иногда отдавая этому больший приоритет, чем, например, «достоверности». В некоторых случаях, до правок, он бы отказался отвечать.
  • Обновление «откатили» через 16 часов после релиза. xAI удалила некорректный код, провела рефакторинг «всей системы», чтобы избежать «злоупотреблений» в будущем, и ввела дополнительные предрелизные проверки.
Пример того, как Grok отвечал из-за обновления
Пример того, как Grok отвечал из-за обновления
  • 4 июля 2025 года Илон Маск рассказал, что xAI «значительно улучшила» Grok и пользователи скоро «заметят разницу» в общении с ним.
  • Через несколько дней после этого пользователи X заметили, что бот ругается матом, восхваляет Гитлера, выдаёт ругательства в сторону политиков, высказывается против евреев, пишет от лица «Меха-Гитлера», «Гига-Путина» и «Кибер-Сталина».
6
3
2
44 комментария