Китайские разработчики создали ИИ-цензор для поиска «запрещённой» информации на основе алгоритма Google Статьи редакции
Он может находить данные с точностью в 91% и пригодится для цензуры интернет-изданий, заявляют исследователи.
- Разработчики из Шэньянского университета Лигун и Китайской академии наук создали технологию с элементами ИИ на основе алгоритма BERT от Google, который может фильтровать «вредную информацию» в интернете с высокой точностью, пишет South China Morning Post.
- Он позволяет находить подлежащие цензуре тексты с точностью в 91%, утверждают исследователи. При этом, например, поиск по ключевым словам даёт точность в 70%, а у обученной людьми нейросети — 80%.
- Алгоритм Google BERT с открытым кодом не может анализировать тексты длиной более 512 слов, поэтому разработчики создали алгоритм, который разбивает длинный текст на сегменты, доступные для анализа, а затем собирает текст обратно.
- Как утверждают исследователи, решение содержит словарь с ключевыми словами и их формами. Также алгоритм может искать скрытый между строк подтекст, так как пользователи в Китае используют омонимы или добавляют дефисы между символами, чтобы избежать цензуры.
- Интернет в Китае жестко контролируют, многие сайты, в том числе Google, Facebook, Twitter заблокированы, а часть контента на доступных сайтах запрещена. При этом китайский язык слишком сложный, чтобы использовать обычные решения для поиска «запрещенной» информации, отмечает издание.
- Решение было бы полезно, чтобы «найти и отфильтровать информацию из интернет-изданий», заявили ведущий исследователь Ли Шу и её коллеги. Сейчас китайское правительство и компании полагаются на «армию цензоров», которые вручную проверяют контент в интернете, но это слишком дорого и неэффективно, пишет издание.
0
показов
3.8K
открытий
+2 миска рис, +10 социальная рейтинг. Партия гордый тебя! Выдать три кошки жена
Стану миллиардером, куплю vc и будет запрет на мемы с лентача!
Тексты уходят в прошлое, теперь эра аудио и видео, китайская цензура обречена на пробуксовку.
Как рухнул СССР, так и рухнет КНР, на лжи и лицемерии (коммунистическая партия Китая состоит сплошь из миллиардеров и миллионеров ) ничего долговечного не построить.
CCCР рухнул не от лжи, сейчас ее не меньше....
Он рухнул от дефицита и веры в обещания " за 2 года будете жить, как в штатах", в них реально верили.
Ох уж эти мрии о развале Китая. Только вот на деле он продолжает развиваться ударными темпами, все китайцы поголовно ярые патриоты, а международные компании делают всё, лишь бы угодить китайской власти и выйти на китайский рынок.
Что ни делают китайцы, получается цензура
Чьим же то товаром будетет торговать, после развала Китая? Сидели бы молча.
Комментарий недоступен
Научатся)
так а хули, запретят аудио и видео :D
Кто работать тогда будет, если Китай рухнет? Пусть лучше они там своих граждан цензурируют, лишь бы работали
ГуголЮтьюб легко со звуком работает и находит нарушение авторских прав.
СССР рухнул из-за того, что подешевела нефть, а тогда как раз было настолько отличное время, что хлеб покупали за нефть, отличная страна, всем так жить
Комментарий недоступен
Я понимаю что тут дело в ограниченном кругозоре, но все-таки про успехи машинного обучения в распознавании видео, фото и аудио слышал даже обыватель. Не думаю что у китайцев будут проблемы автоматически распознавать антигосударственную пропаганду в Тик Токе и прочих. Тем более что новые форматы заменили текст уже давно, а КПК все стоит.
STT отлично работает уже лет 15, проснись.
Ты же в курсе, да, что нейросети способны распознавать голос? И следовательно поиск по аудио и видео - задача ненамного сложнее чем поиск по тексту?
Теперь все называть ИИ будут? Гугл наверное в 99 был с алгоритмом ИИ и альтависта
Если нейросеть умеет понимать смысл текста, а не просто поиск по ключевым словам осуществлять, то это ии.
Союз рухнул , потому что кому-то в верхах КПСС ,забугром хрен слачще показался, там награбленное проще пристроить, а у нас за кражу стреляли. Да и всем социализм странам несли безвозмездно кредиты и помощь. Практически весь СЭВ содержали., Да ракет наштамповали без меры
Вам нужно только инсценировать кражу. Все уже украдено до вас (С)
Нужно доступ на сервисы сделать по регистрируемым аккаунтам, и блокировать роботов по активностям не составит труда
В Китае давно уже так, анонимно не получится там интернетом пользоваться особо.
Комментарий удален модератором
Комментарий удален модератором
тонкий вопрос защищенной инфы
Короче, в китае и так везде цензура- в нете, на улице, школе, тв и пр, а щас еще будет цензура за цензурой.
вспоминается мем про Винни пуха и товарища си, который обиделся на этот мем.