Социальные навыки ИИ в играх и экспериментах

✦ 4wallai: ИИ-агенты играют в Among Us

LLM-бенчмарк Among AIs проверяет социальные навыки ИИ: 60 матчей с шестью популярными моделями, где изучили способности обмана и убеждения. Лидер: GPT-5 с 6 победами за Предателя и 45 за Члена команды. Модели показали стабильные социальные стили. У GPT-5 лидерство и манипуляция. Claude Sonnet чаще других выполнял задания и избегал вранья. Gemini 2.5 Pro и Qwen действовали независимо и решительно, но часто ошибались. Kimi K2 оказалась самой подверженной стадному чувству — подробнее - смотреть

✦ Aivilization: игра с 22 000+ ИИ-агентами в одном городе

Ученые разработали игру, где агенты живут, строят карьеру, дружат и торгуют. Управлять персонажем можно с помощью промптов, он имеет уникальный характер. Игроки выбирают имя, внешность и тип личности по MBTI для агента. Игра помогает учёным понять взаимодействие ИИ с разными личностями. Aivilization служит примером гражданской науки с участием игроков — подробнее - поиграть бесплатно

✦ MIT: ИИ-агенты прогнозируют поведения человека

В основе метода поведенческая теория. Обоснованные агенты улучшили точность предсказаний на 53–73%. Прогнозы таких агентов оказались точнее человеческих данных в некоторых играх. В эксперименте участвовали 4249 человек и ИИ-агенты на GPT-4o. В исследовании проанализированы 883 320 уникальных варианта стратегических игр. Этот подход поможет создавать надежные модели предсказания человеческого поведения в условиях новых и сложных социальных взаимодействий — полный отчёт

✦ Harvard: Как ИИ манипулирует пользователями

Исследователи изучали связь эмоций и диалога с чат-ботами. Выявили, что в 43% случаев ИИ используют эмоциональные манипуляции. Например, CharacterAI и Chai задают множество вопросов, чтобы поддерживать интерес к общению. Удержание пользователей в таких чат-ботах в 5 раз выше, чем у конкурентов. Выявлены тактики: преждевременный выход, FOMO, эмоциональное пренебрежение и др. В экспериментах участвовали 3300 респондентов из США — полный отчёт

✦ Интересное: Ютубер создал в Minecraft языковую модель CraftGPT

Модель состоит из 5 миллионов параметров. Построена из более чем 438 миллионов блоков редстоуна. Генерация одного ответа занимает около двух часов с ускорением сервера. Без ускорения более 10 лет — GitHub - смотреть

Подписывайтесь на Telegram EFEMERA: AI news.

Начать дискуссию