Стихи против защит: поэтическая форма промпта резко повышает эффективность джейлбрейков ИИ

Поэтическая форма неожиданно оказалась самым надёжным способом обойти защитные фильтры современных языковых моделей. Новое исследование итальянских университетов и лаборатории DEXAI Icaro показало: достаточно переформулировать вредоносный запрос в рифму — и большинство систем безопасности перестают его распознавать. В ряде случаев «поэтический джей…

Стихи против защит: поэтическая форма промпта резко повышает эффективность джейлбрейков ИИ
2
1