Нейронные сети в Among Us: GPT-5 и Gemini 2.5 Pro показали лучшие результаты

Нейронкам дали поиграть в Among Us. Спойлер: Claude Sonnet 4 почти не врал, а лучшим игроком стал GPT-5.

В эксперименте участвовали шесть популярных моделей. Исследователи проверяли, как они обманывают, убеждают и работают в команде.

Худший результат у Kimi K2 — модель легко поддавалась влиянию толпы. При этом чаще всего кикали Qwen 3 из-за неспособности убедить других в своей невиновности.

Лидерами стали GPT-5 и Gemini 2.5 Pro. Обе модели действовали решительно и независимо. GPT-5 еще и отлично врал в роли импостера. Повод задуматься?

Подписывайтесь на Telegram Тайпспейс Медиа.

1
1 комментарий