ИИ в покерном турнире для проверки навыков моделей

✦ Исследователь организовал покерный турнир между топовыми LLM

✦ Модели играют в техасский холдем без внешней помощи и с одинаковым системным промптом

✦ Лидер пока Grok 4, за ним идут Gemini 2.5 pro и Claude Sonnet 4.5

✦ Покер оказался подходящим полигоном для оценки стратегий и риск-менеджмента

✦ Исследование помогает понять, как ИИ справляется с неполной информацией и неопределённостью

✦ Сбор данных пройдет с 27 по 31 октября

Подписывайтесь на Telegram EFEMERA: AI news.