Если интригующий ИИ устроит какую-то шутку или причинит вред, жертве не будет важно, имела ли модель злой умысел или нет. Apollo осторожно описывает действия моделей с точки зрения не намерений, а их действий и использованного языка. "Когда мы анализируем цепочку рассуждений [этих моделей], мы обнаруживаем, что они явно продумывают свои планы интриганства и часто используют такие слова, как ‘саботаж, ложь, манипуляция…", говорится в резюме статьи Apollo.
Тревожная информация о развитии искусственного интеллекта.
Будем надеяться, что предусмотрят какие-то меры безопасности)
И так козней полно, а тут ещё и ИИ подключается)