Китайские разработчики создали ИИ-цензор для поиска «запрещённой» информации на основе алгоритма Google Статьи редакции

Он может находить данные с точностью в 91% и пригодится для цензуры интернет-изданий, заявляют исследователи.

Разработчики из Шэньянского университета Лигун и Китайской академии наук создали технологию с элементами ИИ на основе алгоритма BERT от Google, который может фильтровать «вредную информацию» в интернете с высокой точностью, пишет South China Morning Post.
Он позволяет находить подлежащие цензуре тексты с точностью в 91%, утверждают исследователи. При этом, например, поиск по ключевым словам даёт точность в 70%, а у обученной людьми нейросети — 80%.
Алгоритм Google BERT с открытым кодом не может анализировать тексты длиной более 512 слов, поэтому разработчики создали алгоритм, который разбивает длинный текст на сегменты, доступные для анализа, а затем собирает текст обратно.
Как утверждают исследователи, решение содержит словарь с ключевыми словами и их формами. Также алгоритм может искать скрытый между строк подтекст, так как пользователи в Китае используют омонимы или добавляют дефисы между символами, чтобы избежать цензуры.
Интернет в Китае жестко контролируют, многие сайты, в том числе Google, Facebook, Twitter заблокированы, а часть контента на доступных сайтах запрещена. При этом китайский язык слишком сложный, чтобы использовать обычные решения для поиска «запрещенной» информации, отмечает издание.
Решение было бы полезно, чтобы «найти и отфильтровать информацию из интернет-изданий», заявили ведущий исследователь Ли Шу и её коллеги. Сейчас китайское правительство и компании полагаются на «армию цензоров», которые вручную проверяют контент в интернете, но это слишком дорого и неэффективно, пишет издание.

#новость #китай

0 показов

3.8K открытий

1 репост

130 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Денис Демидов

14.04.2021

Тексты уходят в прошлое, теперь эра аудио и видео, китайская цензура обречена на пробуксовку.
Как рухнул СССР, так и рухнет КНР, на лжи и лицемерии (коммунистическая партия Китая состоит сплошь из миллиардеров и миллионеров ) ничего долговечного не построить.

Ответить

Развернуть ветку

Дмитрий Ригель

14.04.2021

теперь эра аудио и видео, китайская цензура обречена на пробуксовку.

Научатся)

Ответить

Развернуть ветку

Алексис Второй

14.04.2021

Что мешало «N-word» включить в раздел «Racism»? Хотя зачем я это спрашиваю, если у нас есть настройка для регулирования уровня «White nationalism».

Ответить

Развернуть ветку

Дмитрий Ригель

14.04.2021

Черные вроде могут это слово говорить, им неудобно будет отключать если в расизм закинуть, поэтому отдельно для них сделали.

Ответить

Развернуть ветку

Алексис Второй

14.04.2021

AI вряд ли будет достоверно определять по голосу и лексикону цвет кожи, значит белые тоже смогу говорить то самое заветное запретное слово «N-word», а раз это слово не включено в блок расизма, значит разработчик не считает это слово расистским.

В любом случае, рты затыкать должно воспитание и риск получить по лицу, а не технологии, которые везде суют под соусом блага для социума. Если в игре кто-то полюбил твою мамку, то никто не запрещает в ответ полюбить всю его семью. Удивляет, какие все нежные стали.

Ответить

Развернуть ветку

Показать 130 комментариев . Вы видите только часть дискуссии

Написать комментарий...

127 комментариев

Раскрывать всегда