Анализируя результаты, исследователи подчеркивают несколько важных ограничений своей работы. Прежде всего, все тестовые сценарии были намеренно упрощены – модели получали слишком явные указания на противоречия, что редко встречается в реальных условиях. Кроме того, остается открытым вопрос: действительно ли наблюдаемое поведение является результатом осмысленного анализа ситуации, или модели просто воспроизводят паттерны из обучающих данных?
Мне кажется, что если показать эту статью простому человеку, то он увидит результаты о том, что ИИ пытается обмануть и всё, подумает что скоро будет Skynet из терминатора) По факту вы правильно подметили, что те задачи, которые им давали по сути напрямую говорили, что нужно обойти правила. К тому же каждая модель на данным момент дописывается, улучшается, поэтому вероятность наступления судного дня, по крайней мере на данный момент, крайне мала)