Китайские разработчики создали ИИ-цензор для поиска «запрещённой» информации на основе алгоритма Google Статьи редакции

Он может находить данные с точностью в 91% и пригодится для цензуры интернет-изданий, заявляют исследователи.

  • Разработчики из Шэньянского университета Лигун и Китайской академии наук создали технологию с элементами ИИ на основе алгоритма BERT от Google, который может фильтровать «вредную информацию» в интернете с высокой точностью, пишет South China Morning Post.
  • Он позволяет находить подлежащие цензуре тексты с точностью в 91%, утверждают исследователи. При этом, например, поиск по ключевым словам даёт точность в 70%, а у обученной людьми нейросети — 80%.
  • Алгоритм Google BERT с открытым кодом не может анализировать тексты длиной более 512 слов, поэтому разработчики создали алгоритм, который разбивает длинный текст на сегменты, доступные для анализа, а затем собирает текст обратно.
  • Как утверждают исследователи, решение содержит словарь с ключевыми словами и их формами. Также алгоритм может искать скрытый между строк подтекст, так как пользователи в Китае используют омонимы или добавляют дефисы между символами, чтобы избежать цензуры.
  • Интернет в Китае жестко контролируют, многие сайты, в том числе Google, Facebook, Twitter заблокированы, а часть контента на доступных сайтах запрещена. При этом китайский язык слишком сложный, чтобы использовать обычные решения для поиска «запрещенной» информации, отмечает издание.
  • Решение было бы полезно, чтобы «найти и отфильтровать информацию из интернет-изданий», заявили ведущий исследователь Ли Шу и её коллеги. Сейчас китайское правительство и компании полагаются на «армию цензоров», которые вручную проверяют контент в интернете, но это слишком дорого и неэффективно, пишет издание.
0
130 комментариев
Написать комментарий...
Денис Демидов

Тексты уходят в прошлое, теперь эра аудио и видео, китайская цензура обречена на пробуксовку. 
Как рухнул СССР, так и рухнет КНР, на лжи и лицемерии (коммунистическая партия Китая состоит сплошь из миллиардеров и миллионеров ) ничего долговечного не построить.

Ответить
Развернуть ветку
Дмитрий Ригель
теперь эра аудио и видео, китайская цензура обречена на пробуксовку.

Научатся)

Ответить
Развернуть ветку
Алексис Второй

Что мешало «N-word» включить в раздел «Racism»? Хотя зачем я это спрашиваю, если у нас есть настройка для регулирования уровня «White nationalism».

Ответить
Развернуть ветку
Дмитрий Ригель

Черные вроде могут это слово говорить, им неудобно будет отключать если в расизм закинуть, поэтому отдельно для них сделали.

Ответить
Развернуть ветку
Алексис Второй

AI вряд ли будет достоверно определять по голосу и лексикону цвет кожи, значит белые тоже смогу говорить то самое заветное запретное слово «N-word», а раз это слово не включено в блок расизма, значит разработчик не считает это слово расистским.
 
В любом случае, рты затыкать должно воспитание и риск получить по лицу, а не технологии, которые везде суют под соусом блага для социума. Если в игре кто-то полюбил твою мамку, то никто не запрещает в ответ полюбить всю его семью. Удивляет, какие все нежные стали.

Ответить
Развернуть ветку
127 комментариев
Раскрывать всегда