{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Как заблокировать навязчивую рекламу с помощью ИИ: кейс Sentinel

https://adblockplus.org

Спустя всего четыре месяца после запуска проекта Sentinel искусственный интеллект уже научился распознавать навязчивую рекламу. Хочу рассказать вам, как этого удалось добиться и каких изменений стоит ждать в индустрии.

Блокировщики сегодня все еще применяют фильтры, которые сканируют код страницы, вычленяют из него рекламные элементы и блокируют или скрывают их. Уже в ближайшем будущем искусственный интеллект может кардинально изменить этот механизм, определяя рекламу по ее внешнему виду. Для этого используются алгоритмы компьютерного зрения - те же, что применяют в разработках беспилотных автомобилей. Пока ИИ умеет точно определять, какой контент является рекламой, а какой нет, в социальной сети Facebook. Но уже в перспективе научится делать это повсеместно.

С чем столкнулись разработчики

Если, например, при изучении иностранного языка, человеку требуются десятки примеров, чтобы запомнить какое-либо правило, то в случае с искусственным интеллектом речь идет уже о тысячах и даже миллионах образцов, на которых он будет обучаться. Поэтому главная сложность для любого подобного проекта - сформировать базу данных. В случае Sentinel разработчики собирали скриншоты с рекламными объявлениями из социальной сети Facebook. На это ушло примерно 85% времени, потраченного на проект. На одном из этапов присылать скриншоты с рекламой попросили даже самих пользователей. Тем не менее процесс занял больше времени, чем изначально предполагалось - социальная сеть оказалась не бесконечной и в какой-то момент разработчики собирали информацию быстрее, чем Facebook её обновлял.

Кроме того, большинство рекламодателей и площадок сегодня стремятся сделать свою рекламу нативной - максимально приблизить ее к естественному контенту и тем самым сделать менее раздражающей. В результате этого, например, в социальной сети Facebook и контент, и реклама выглядят практически идентично. Как правило, отличить одно от другого можно только с помощью лейблов “реклама”, “спонсорский материал” и аналогичных. В теории можно было бы сразу настроить искусственный интеллект так, чтобы он искал такого рода маркировку. Однако разработчикам проекта Sentinel было, в первую очередь, интересно натренировать алгоритм самостоятельно отличать рекламу от не рекламы и проследить, на что он будет при этом ориентироваться. Ведь человек способен понять, что это реклама, не только по маркировке, но и по некоторым другим косвенным признакам. Впрочем, когда ИИ все-таки научился искать рекламу на Facebook, выяснилось, что он определяет ее только по лейблам. То есть человек пока справляется с этой задачей лучше.

Зачем вообще блокировщикам ИИ?

Сегодня блокировка рекламы происходит с помощью фильтров и в условиях, где память ограничена (например, на мобильных устройствах), они нередко занимают больше памяти, чем нужно для бесперебойной работы устройства.. В этих случаях как раз могли бы помочь алгоритмы искусственного интеллекта, ведь их можно представить в памяти компактнее. Но здесь есть две сложности. Во-первых, пока текущий алгоритм хорошо научился распознавать рекламу только в социальной сети Facebook, и чтобы также успешно делать это на других платформах, ему понадобятся миллионы новых примеров. То есть разработчикам по сути потребуется сформировать новую базу для его тренировки. И заново начать процесс обучения. В перспективе также можно натренировать еще один алгоритм, который будет работать в паре с этим: один будет блокировать или прятать рекламу, а другой говорить ему, правильно ли выполнено действие.

А во-вторых, натренированную модель необходимо перенести на мобильные платформы. Что также требует определенных усилий. Это как раз то, над чем сейчас работает компания. Уже с нового года технологию планируется постепенно задействовать в реальных продуктах.

Кроме того, на данном этапе ИИ уже может совершенствовать имеющиеся фильтры. Он способен работать параллельно с фильтрами анализировать, вся ли реклама на странице блокируется. Уже сейчас бывает, что алгоритм уверен - какой-то элемент - реклама, и его нужно заблокировать, однако фильтры при этом его пропускают. Тогда мы проверяем это вручную, и бывает, что фильтры работают не совсем корректно.

Sentinel - это первый проект с использованием машинного обучения в Adblock Plus. Он позволил нам определиться, как именно мы будем использовать искусственный интеллект для блокировки навязчивой рекламы, и запустить несколько следующих проектов. Хотя сам Sentinel как алгоритм ИИ может и не получит продолжения. Забавно, но обучив его распознавать рекламу в Facebook, мы пришли к тому, что для этого в общем-то не нужно использовать машинное обучение. Достаточно просто научить алгоритм находить маркировки, которые используются для обозначения рекламного контента. И сейчас мы как раз формируем базу таких лейблов.

https://adblockplus.org

Что дальше?

Сегодня блокировщики по большей части используют уже готовые алгоритмы и технологии, иногда такие же как применяются в беспилотных автомобилях, например, для распознавания светофоров и других машин на дороге. А потому в том, как искусственный интеллект внедряют в автомобили, можно усмотреть некоторые параллели с тем, что сейчас происходит с блокировщиками навязчивой рекламы.

Процесс создания машин без водителей традиционно принято делить на пять этапов. На нулевом искусственный интеллект еще никак не применяется. На первом этапе появляются некоторые функции, которые лишь отчасти помогают людям водить. На втором - работает гибридная система, где некоторые решения принимает машина, а некоторые - человек. На третьем этапе искусственный интеллект уже отвечает за полный набор функций в управлении автомобилем в ограниченном наборе сценариев. На четвертом - машина способна ездить автономно, однако человек все еще осуществляет контроль для «подстраховки». И наконец, на пятом этапе мы имеем беспилотные автомобили. Отрасль на данный момент находится где-то на третьем уровне. В то время как блокировщики рекламы пока, скорее, между первым и вторым уровнем. Они уже помогают людям создавать фильтры и даже могут в некоторых случаях блокировать навязчивую рекламу - как, например, Sentinel распознает объявления в Facebook. Но при этом все понимают, что достичь пятого этапа - чтобы всю блокировку рекламы осуществлял искусственный интеллект и у людей не было необходимости постоянно писать и обновлять фильтры - вряд ли удастся в ближайшие пару лет.

К тому же здесь есть и своего рода этический вопрос. Применение алгоритмов для формирования ленты в Facebook уже вызвало немало нареканий со стороны пользователей. Людям чаще всего не нравится, когда что-то за них решает искусственный интеллект.

0
Комментарии
-3 комментариев
Раскрывать всегда