ИИ в покерном турнире для проверки навыков моделей
✦ Исследователь организовал покерный турнир между топовыми LLM
✦ Модели играют в техасский холдем без внешней помощи и с одинаковым системным промптом
✦ Лидер пока Grok 4, за ним идут Gemini 2.5 pro и Claude Sonnet 4.5
✦ Покер оказался подходящим полигоном для оценки стратегий и риск-менеджмента
✦ Исследование помогает понять, как ИИ справляется с неполной информацией и неопределённостью
✦ Сбор данных пройдет с 27 по 31 октября
Подписывайтесь на Telegram EFEMERA: AI news.
Начать дискуссию