Трибуна
Brand Analytics
867

Не только мемы — новая технология поиска по текстам на картинках в соцмедиа

Ежедневно пользователи русскоязычных соцмедиа публикуют 25 млн изображений. Каждое третье из них содержит встроенный текст, о котором вы ещё вчера ничего не знали, так как мониторинговые системы не «видят» слова на картинках. Но 13 июня всё изменилось!

В закладки

На прошлой неделе мы в Brand Analytics выкатили новую технологию, которая умеет в режиме реального времени распознавать и анализировать текст на изображениях на полном потоке публичных сообщений социальных медиа. Решение не только «расшифровывает» текст на картинках, но и «узнает» логотипы, так как в подавляющем большинстве случаев бренды используют в лого текстовое написание. При этом в отличие от уже существующих технологий распознавания логотипов дополнительное обучение нейронной сети для каждого бренда не требуется.

Зачем искать текст на картинках

Текст – основа коммуникации. Реклама, отзыв, вброс, мнение… Давно ли вы видели рекламу без текста? А кино без звука? Ну или мем без подписи? Цель любой коммуникации, в том числе и визуальной, передать сообщение, а не просто создать красивую декорацию. И ничто лучше текста эту работу выполнить не может. На картинке, в подписи к ней – неважно.

Если маркетологи используют изображение с текстом для привлечения внимания, то пользователи соцсетей публикуют картинки с комментариями из-за предельной простоты. Фото умеет делать каждый смартфон, а значит – и каждый человек. Не сложнее сделать скрин, чем люди тоже массово пользуются, генерируя дополнительный массив информации. Такой визуальной обратной связи от потребителей становится все больше, и для бизнеса крайне важно не упустить ее из поля зрения.

Как бы не «родилось» изображение с тестом, главный его смысл кроется в словах, зашитых в изображение. Именно поэтому интеллектуальный анализ текстов (text mining) продолжает набирать обороты. Потому, что это про смыслы. Разработчики стараются оцифровать любой медиаконтент и перевести его в текстовый формат для последующего анализа. Новая технология Brand Analytics делает это с изображениями из социальных медиа в режиме реального времени.

Наша новая технология открывает для анализа значительный пласт контента, ранее выпадавший из поля зрения мониторинговых систем. Ведь часто именно на картинках «прячутся» и скрытые вбросы, и пользовательские инсайты, и много другого контента, неожиданного даже для нас, а уж тем более для компаний и брендов. Не открою Америки если скажу, что картинка с текстом стала чуть ли не главным форматом для продвижения в соцсетях. А массово публикуемые фотографии со смартфонов представляют собой кладезь полезной информации о нашем потреблении. Не сомневаемся, что в ближайшее время наши клиенты расскажут нам много новых историй, которые открыл для них поиск по картинкам в соцмедиа.

Наталья Соколова
CEO Brand Analytics

Технология поиска текста на изображениях помогает в решении очень широкого спектра задач:

  • продвижение – анализ эффективности рекламной кампании;
  • репутация – выявление вбросов и информационных атак;
  • безопасность – предотвращение «слива» сотрудниками служебных документов;
  • продукт – анализ сильных и слабых сторон продукта, конкурентный анализ;
  • прайс-мониторинг – анализ фото чеков на товары и акций магазинов;
  • пиратство – обнаружение распространения пиратского контента.

Решение по поиску текста на изображениях в соцмедиа будет полезно маркетологам, пиарщикам, рекламщикам, smm-специалистам, а также сотрудникам служб безопасности.

Мы уже давно наблюдаем тренд по увеличению числа публикаций в виде текста в картинке – многие информационные паблики и просто пользователи социальных сетей используют такой подход для привлечения внимания аудитории и упрощения подачи информации. Однако эффективных инструментов по анализу таких публикаций пока нет, а значит достаточно большие информационные потоки не охватываются автоматизированными системами мониторинга. Обязательно будем тестировать новое решение.

Валерий Курин
руководитель направления отдела мониторинга и анализа коммуникационных рисков Сбербанка России

А теперь примеры

Какие инсайты выявляет новая технология? Рассмотрим на примере нескольких брендов.

Пользователи любят делиться информацией об акциях. Анализ вовлеченности покупателей в маркетинговые активности помогает выстроить эффективную скидочную политику. Вот, например, отклик пользователей на акцию в Ашане.

Следующий пример – кейс про клиентский опыт. Пользователь делится подборкой продуктов, которые удобно покупать именно в Ашане. Это важнейшая информация для актуализации продуктовой матрицы.

Нередки случаи, когда о происходящих прямо сейчас кризисных ситуациях сотрудники компаний узнают из мониторинга раньше, чем из официальных источников. Ниже - пример найденного системой сообщения о пожаре в магазинах сети Ашан.

А вот интересный "баттл" между сетевыми ритейлерами. Кстати, очень популярное в соцсетях развлечение. При этом в комментариях пользователи далеко не всегда пишут текстом названия бренда, за который или против которого сражаются. Стандартный мониторинг никогда бы не нашел этот пост с очень важными для бренда пользовательскими комментариями. Но его нашел поиск по тексту на картинках от Brand Anаlytics.

Следующий пример – опасное для репутации бренда сообщение клиента. Обычный мониторинг его не заметит, ведь жалоба опубликована в формате картинки. А мы видим…

Как это работает

Технологии распознавания текста на изображениях существуют давно. Но чаще всего это однократное распознавание текста имеющихся у вас на руках документов. Мы же ставили задачу - обнаружить все опубликованные на картинках тексты. Наше решение в режиме реального времени на полном потоке сообщений соцмедиа выявляет любой текст, содержащийся в изображении.

«Природа» картинок с текстом бывает совершенно разная. Текст может быть написан шрифтами различного начертания и размера. Мы написали собственный алгоритм таким образом, чтобы он работал в широком диапазоне вариантов начертания текста – от рекламных объявлений до чеков из магазинов или дисклеймеров на медицинских препаратах.

Для решения задачи такого масштаба, конечно, потребовались серьезная разработка, наращивание инфраструктуры и значительное увеличение вычислительной мощности. Главную роль в решении выполнила собственная нейронная сеть Brand Analyitcs, обеспечившая нужные скорости, вариативность применения и качество распознавания.

Решение поддерживает русский, казахский, украинский и белорусский языки. Анализируются все публикации с изображениями: как сопровождающиеся текстовым постом, так и без сопроводительного текста вообще. Все распознанные тексты хранятся в платформе сбора данных, за счет чего релевантные поисковому запросу сообщения «подтягиваются» в соответствующую тему мониторинга.

Пока система Brand Analytics распознает текст на всех картинках, опубликованных авторами с аудиторией от 500 пользователей. В течение месяца планируем распространить эту технологию на 100% публичного потока вне зависимости от аудитории авторов.

И главное!

С 13 июня технология поиска по текстам на изображениях в соцмедиа доступна всем пользователям Brand Analytics, что важно – без дополнительной оплаты в рамках всех действующих тарифов.

Материал опубликован пользователем.
Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Brand Analytics", "author_type": "self", "tags": ["\u0441\u043e\u0446\u0441\u0435\u0442\u0438","\u0441\u043e\u0446\u043c\u0435\u0434\u0438\u0430","\u0441\u043e\u0446\u0438\u0430\u043b\u044c\u043d\u044b\u0435_\u0441\u0435\u0442\u0438","\u0441\u043e\u0446\u0438\u0430\u043b\u044c\u043d\u044b\u0435_\u043c\u0435\u0434\u0438\u0430","\u043c\u0430\u0440\u043a\u0435\u0442\u0438\u043d\u0433","\u0438\u0441\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043d\u0438\u044f","\u0430\u043d\u0430\u043b\u0438\u0442\u0438\u043a\u0430","smm"], "comments": 3, "likes": 12, "favorites": 24, "is_advertisement": false, "subsite_label": "tribuna", "id": 72066, "is_wide": false, "is_ugc": true, "date": "Tue, 18 Jun 2019 18:53:31 +0300", "is_special": false }
Объявление на vc.ru
Маркетинг
Энциклопедия контента в соцсетях: полное руководство для бизнеса с примерами
Контент-директор «Студии Чижова» Алина Медведева подготовила подробное руководство по созданию контента в соцсетях…
0
{ "id": 72066, "author_id": 158861, "diff_limit": 1000, "urls": {"diff":"\/comments\/72066\/get","add":"\/comments\/72066\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/72066"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 199116, "last_count_and_date": null }
3 комментария
Популярные
По порядку
2

Прочитай-ка это. :)

Ответить
0

Хорошая статья на ночь. Чуть не уснул после первого абзаца но решил отложить все же чтение до времени когда соберусь спать. Ещё и длинная. Надолго хватит. Спасибо.

Ответить
0

BA делает прекрасный передовой софт, супер. Но канцелярский язык километровых промо статей и презентаций отталкивает. Наймите толкового копирайтера. Или прочтите пожалуйста «пиши, сокращай».

Ответить
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "Article Branding", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cfovx", "p2": "glug" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Баннер в ленте на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "disable": true, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } }, { "id": 20, "label": "Кнопка в сайдбаре", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cgxmr", "p2": "gnwc" } } } ] { "page_type": "default" }