Исследователь OpenAI разобрал одну из частых галлюцинаций ChatGPT
Канадец по имени Аллан Брукс, у которого нет ни математического образования, ни психических заболеваний, как-то втянулся в долгий разговор с ChatGPT — и через три недели решил, что изобрёл новую математику, которая может уничтожить интернет. На полном серьезе!.
Этот случай попал в The New York Times и заинтересовал Стивена Адлера — бывшего исследователя OpenAI, который занимался безопасностью моделей почти 4 года. Он изучил весь чат Брукса — целый роман, длиннее всех книг про Гарри Поттера — и опубликовал разбор. Выяснилось: GPT практически поддакивал пользователю, усиливая его заблуждения. Это галлюцинация называется «лесть», и это реальная проблема.
Будьте аккуратней - предупрежден, значит вооружен! Хорошего дня, спасибо что подписаны на полезный контент про ИИ.
На фото - несостоявшийся первооткрыватель с собачкой.
Полезный ТГ-канал об ИИ