Не только мемы — новая технология поиска по текстам на картинках в соцмедиа

Ежедневно пользователи русскоязычных соцмедиа публикуют 25 млн изображений. Каждое третье из них содержит встроенный текст, о котором вы ещё вчера ничего не знали, так как мониторинговые системы не «видят» слова на картинках. Но 13 июня всё изменилось!

На прошлой неделе мы в Brand Analytics выкатили новую технологию, которая умеет в режиме реального времени распознавать и анализировать текст на изображениях на полном потоке публичных сообщений социальных медиа. Решение не только «расшифровывает» текст на картинках, но и «узнает» логотипы, так как в подавляющем большинстве случаев бренды используют в лого текстовое написание. При этом в отличие от уже существующих технологий распознавания логотипов дополнительное обучение нейронной сети для каждого бренда не требуется.

Зачем искать текст на картинках

Текст – основа коммуникации. Реклама, отзыв, вброс, мнение… Давно ли вы видели рекламу без текста? А кино без звука? Ну или мем без подписи? Цель любой коммуникации, в том числе и визуальной, передать сообщение, а не просто создать красивую декорацию. И ничто лучше текста эту работу выполнить не может. На картинке, в подписи к ней – неважно.

Если маркетологи используют изображение с текстом для привлечения внимания, то пользователи соцсетей публикуют картинки с комментариями из-за предельной простоты. Фото умеет делать каждый смартфон, а значит – и каждый человек. Не сложнее сделать скрин, чем люди тоже массово пользуются, генерируя дополнительный массив информации. Такой визуальной обратной связи от потребителей становится все больше, и для бизнеса крайне важно не упустить ее из поля зрения.

Как бы не «родилось» изображение с тестом, главный его смысл кроется в словах, зашитых в изображение. Именно поэтому интеллектуальный анализ текстов (text mining) продолжает набирать обороты. Потому, что это про смыслы. Разработчики стараются оцифровать любой медиаконтент и перевести его в текстовый формат для последующего анализа. Новая технология Brand Analytics делает это с изображениями из социальных медиа в режиме реального времени.

Наша новая технология открывает для анализа значительный пласт контента, ранее выпадавший из поля зрения мониторинговых систем. Ведь часто именно на картинках «прячутся» и скрытые вбросы, и пользовательские инсайты, и много другого контента, неожиданного даже для нас, а уж тем более для компаний и брендов. Не открою Америки если скажу, что картинка с текстом стала чуть ли не главным форматом для продвижения в соцсетях. А массово публикуемые фотографии со смартфонов представляют собой кладезь полезной информации о нашем потреблении. Не сомневаемся, что в ближайшее время наши клиенты расскажут нам много новых историй, которые открыл для них поиск по картинкам в соцмедиа.

Наталья Соколова, CEO Brand Analytics

Технология поиска текста на изображениях помогает в решении очень широкого спектра задач:

  • продвижение – анализ эффективности рекламной кампании;
  • репутация – выявление вбросов и информационных атак;
  • безопасность – предотвращение «слива» сотрудниками служебных документов;
  • продукт – анализ сильных и слабых сторон продукта, конкурентный анализ;
  • прайс-мониторинг – анализ фото чеков на товары и акций магазинов;
  • пиратство – обнаружение распространения пиратского контента.

Решение по поиску текста на изображениях в соцмедиа будет полезно маркетологам, пиарщикам, рекламщикам, smm-специалистам, а также сотрудникам служб безопасности.

Мы уже давно наблюдаем тренд по увеличению числа публикаций в виде текста в картинке – многие информационные паблики и просто пользователи социальных сетей используют такой подход для привлечения внимания аудитории и упрощения подачи информации. Однако эффективных инструментов по анализу таких публикаций пока нет, а значит достаточно большие информационные потоки не охватываются автоматизированными системами мониторинга. Обязательно будем тестировать новое решение.

Валерий Курин, руководитель направления отдела мониторинга и анализа коммуникационных рисков Сбербанка России

А теперь примеры

Какие инсайты выявляет новая технология? Рассмотрим на примере нескольких брендов.

Пользователи любят делиться информацией об акциях. Анализ вовлеченности покупателей в маркетинговые активности помогает выстроить эффективную скидочную политику. Вот, например, отклик пользователей на акцию в Ашане.

Не только мемы — новая технология поиска по текстам на картинках в соцмедиа

Следующий пример – кейс про клиентский опыт. Пользователь делится подборкой продуктов, которые удобно покупать именно в Ашане. Это важнейшая информация для актуализации продуктовой матрицы.

Не только мемы — новая технология поиска по текстам на картинках в соцмедиа

Нередки случаи, когда о происходящих прямо сейчас кризисных ситуациях сотрудники компаний узнают из мониторинга раньше, чем из официальных источников. Ниже - пример найденного системой сообщения о пожаре в магазинах сети Ашан.

Не только мемы — новая технология поиска по текстам на картинках в соцмедиа

А вот интересный "баттл" между сетевыми ритейлерами. Кстати, очень популярное в соцсетях развлечение. При этом в комментариях пользователи далеко не всегда пишут текстом названия бренда, за который или против которого сражаются. Стандартный мониторинг никогда бы не нашел этот пост с очень важными для бренда пользовательскими комментариями. Но его нашел поиск по тексту на картинках от Brand Anаlytics.

Не только мемы — новая технология поиска по текстам на картинках в соцмедиа

Следующий пример – опасное для репутации бренда сообщение клиента. Обычный мониторинг его не заметит, ведь жалоба опубликована в формате картинки. А мы видим…

Не только мемы — новая технология поиска по текстам на картинках в соцмедиа

Как это работает

Технологии распознавания текста на изображениях существуют давно. Но чаще всего это однократное распознавание текста имеющихся у вас на руках документов. Мы же ставили задачу - обнаружить все опубликованные на картинках тексты. Наше решение в режиме реального времени на полном потоке сообщений соцмедиа выявляет любой текст, содержащийся в изображении.

«Природа» картинок с текстом бывает совершенно разная. Текст может быть написан шрифтами различного начертания и размера. Мы написали собственный алгоритм таким образом, чтобы он работал в широком диапазоне вариантов начертания текста – от рекламных объявлений до чеков из магазинов или дисклеймеров на медицинских препаратах.

Для решения задачи такого масштаба, конечно, потребовались серьезная разработка, наращивание инфраструктуры и значительное увеличение вычислительной мощности. Главную роль в решении выполнила собственная нейронная сеть Brand Analyitcs, обеспечившая нужные скорости, вариативность применения и качество распознавания.

Решение поддерживает русский, казахский, украинский и белорусский языки. Анализируются все публикации с изображениями: как сопровождающиеся текстовым постом, так и без сопроводительного текста вообще. Все распознанные тексты хранятся в платформе сбора данных, за счет чего релевантные поисковому запросу сообщения «подтягиваются» в соответствующую тему мониторинга.

Пока система Brand Analytics распознает текст на всех картинках, опубликованных авторами с аудиторией от 500 пользователей. В течение месяца планируем распространить эту технологию на 100% публичного потока вне зависимости от аудитории авторов.

И главное!

С 13 июня технология поиска по текстам на изображениях в соцмедиа доступна всем пользователям Brand Analytics, что важно – без дополнительной оплаты в рамках всех действующих тарифов.

1313
3 комментария

Прочитай-ка это. :)

2

Хорошая статья на ночь. Чуть не уснул после первого абзаца но решил отложить все же чтение до времени когда соберусь спать. Ещё и длинная. Надолго хватит. Спасибо.

BA делает прекрасный передовой софт, супер. Но канцелярский язык километровых промо статей и презентаций отталкивает. Наймите толкового копирайтера. Или прочтите пожалуйста «пиши, сокращай».