Олимпиада, россияне и нейросеть

Всем привет! Как вы знаете, 23 июля в Токио стартовали ХХXII Летние Олимпийские игры — большой спортивный праздник для болельщиков по всему миру. Участники борются за право стать лучшими, за право попасть в историю. Но соперничество между спортсменами не всегда заканчивается после свистка арбитра и награждения победителя — иногда схватка продолжается в социальных сетях. Нас в Yoloco заинтересовала битва кириллицы с латиницей, которая развернулась в полях Инстаграма под постом Megan Kalmoe – бронзовой призерши Олимпиады 2012 и участницы Олимпиады 2021 года в академической гребле.

Мы решили проанализировать тональность высказываний российских болельщиков и показать возможности искусственного интеллекта в оценке имиджа спортсмена, публичной личности, звезды, человека, бренда в социальных сетях.

Напомню, что произошло.

29 июля 2021 года в Токио россиянки Елена Орябинская и Василиса Степанова выиграли серебро в парном соревновании по академической гребле.

Соперница наших спортсменок Megan Kalmoe написала в своем аккаунте в Твиттере, что ей «неприятно видеть», как россиянки, которые «не должны были участвовать в играх», получили медали.

Твит получил более тысячи комментариев, но наибольшая активность возникла под постом спортсменки в Инстаграм. На аккаунт Megan подписано около 3 тысяч человек, а посты обычно собирают 200-500 лайков и около 30-40 комментариев.

Но после высказывания в Твиттере последний пост Megan в Инстаграм стал стихийной трибуной русскоговорящих пользователей — спортивные болельщики оставили более 12-ти тысяч комментариев с поддержкой российских спортсменов. В течение дня мы проанализировали все.

Что удалось узнать?

Тональность

Проанализировав 12 тысяч комментариев, 73% которых — русскоязычные, наша нейросеть определила среди них:

50% нейтральных комментариев (в данном контексте к ним относятся, к примерунапример, строки из советского стихотворения Орлова, известного многим по фильму "Брат-2".

Я узнал, что у меня Есть огромная семья! И тропинка, и лесок, В поле - каждый колосок.
Речка, небо голубое, Это все мое, родное!

10% — явно негативных.

40% — позитивных комментариев, которые в большей степени относились к слову Россия.

Здесь интересно, что комментаторы достаточно сдержано парировали спортсменке, практически не используя сниженную лексику.

Мы проанализировали 27 тысяч слов — все они собраны в облако.

Детали

Под постом спортсменки комментарии оставили 5302 уникальных пользователя. Почти все профили с небольшим количеством подписчиков и подписок, и только два имеют больше 150 000 подписчиков:

  • https://www.instagram.com/mymilly.ru
  • https://www.instagram.com/zvezdnaiapre

Наиболее активны в комментариях люди в возрасте 25-34 лет — это 69% женщин и 53% мужчин. Что интересно, активно писали комментарии мужчины в возрастной группе 35-44 (37%), в то время как женщин этой возрастной группы тема интересовала значительно меньше (15%). Пол и возраст пользователей мы в Yoloco распознаем с помощью искусственного интеллекта.

Этот график позволяет нам увидеть города, в которых когда-либо чекинились пользователи Инстаграма, оставившие комментарии под постом Megan Kalmoe. То есть если житель Сочи ставил геотег "Москва" на публикации или сторис за все время ведения своего блога, мы увидим эти данные в нашей базе данных.

Другие интересные факты:

  • Среди комментаторов нет ни одного верифицированного аккаунта.
  • 45% владельцев аккаунтов закрыли свой профиль, 55% – оставили свой профиль открытым.
  • Всего лишь 13% владельцев аккаунтов подключили бизнес-профиль, не стали – 87%.
  • 71% комментаторов – женщины, остальные – мужчины.

Также отмечу, что среди комментирующих оказалось много профилей масс-фолловеров. Было даже несколько аккаунтов, у которых больше 7 тыс. подписок.

Кейс

В 2019 году подобный всплеск повышенной активности российских пользователей был отмечен в аккаунте поп-звезды Lady Gaga @ladygaga. Примечательно, что флешмоб под постом знаменитости или «гагачат», как его назвали организаторы и участники – русскоговорящие пользователи социальной сети, стал популярен настолько, что к нему подключились российские звезды. Причиной, предположительно, было то, что Lady Gaga якобы стала яблоком раздора в отношениях актера Брэдли Купера и российской супермодели Ирины Шейк — пользователи пришли поддержать соотечественницу. В итоге пост Lady Gaga собрал более миллиона комментариев.

Делаем выводы

Наглядно видно, что Инстаграм — это площадка для выражения своих чувств, и можно прогнозировать, что такие случаи не останутся единичными.

Инстаграм — это индикатор настроения и отношения людей к тому или иному бренду, количественная и качественная оценка бренда.

Сегодня имидж можно оцифровать, и это то, чем мы занимаемся в Yoloco. Сейчас мы рассмотрели кейс и имидж отдельного спортсмена, и важно понимать, что имидж продукта, компании, бренда также можно измерить и использовать эти данные для выполнения тактических профессиональных задач. Поэтому мы так тщательно работаем с комментариями в социальных сетях — их тональностью и окрасом, применяем методы машинного обучения.

Имидж — это не только комментарии в социальных сетях, эмоциональные оценки и публичные обсуждения, — это перераспределение влияния и лояльность к персоне и бренду, а в денежном эквиваленте — это потенциальные или упущенные рекламные контракты. А для маркетолога эта информация — ключевой инструмент эффективного управления бюджетом и повышения конверсии рекламных интеграций.

0
46 комментариев
Написать комментарий...
Kraftwerk
Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Такова реальность )

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Качественная бото-ферма - это очень дорого и в 99 % случаев проект не будет сходиться по юнит - экономике. Инстаграм умело банит всех ботов. Сейчас выгоднее тратить ботов накрутку лайков и комментариев, но такие боты распознает наша нейросеть. В данном кейсе таких ботов практически нет. 

Проплачивать людям за их комментарии - еще более дорогая история. Тут точно не будет сходиться юнит - экономика. 
Процесс создания уникальных комментариев - это затраты не только на разработку продвинутых NLP - моделей, но и на вычислительные мощности, что опять приводит к юнит - экономике.

Мы пришли к тому, что дешевых ботов распознает наша нейросеть, а дорогие боты просто невыгодны.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Мы не поняли друг друга. 
Вы не учитываете тот факт, что комментарии нужно делать с определенного аккаунта. Если это бот, то такой аккаунт вычисляет наша нейросеть, если это аккаунт человека, то это нужно делать руками, смысл пропадает.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

ML - машинное обучение, это класс искусственного интеллекта. Давайте тогда договоримся, мы все понимаем, что такое ИИ?) Методы машинного обучения основаны на применении нейросетей. 
Для того, чтобы отнести конкретный цифровой объект (аккаунт Инстаграмма) к одному из классов (бот или живой человек), нужен какой-то механизм, это может быть:
- Тупой алгоритм, например, если больше 500 подписчиков, то это аккаунт живого человека
- Регрессионная модель, которая на вход, например, получает кол-во подписчиков и кол-во постов и потом дает прогноз. Y = a + b*X. Простой и иногда рабочий прием, но не в случае определения ботов, где зависимость результата от факторов сложная и нелинейная
- Простая нейронная сеть (многослойный перцептрон) хороша, когда есть большой датасет для обучения. В нашем случае у нас есть большой датасет: аккаунты живых людей и аккаунты ботов. Также у нас есть более 20 факторов, знаний о каждом аккаунте (текст из шапки профиля, кол-во подписчиков, средняя вовлеченность на посте и тд). Мы выбрали самый сложный, но самый точный способ определения ботов.

Модели и хороши тем, что они показывают на боьших объемах хорошие средние результаты. У нас на объемах 95 % точности и мы ее улучшаем постоянно. 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Мы не говорили, что определяем по кол-ву подписчиков, постов только. Есть более 20 факторов, по которым можно классифицировать аккаунт. Мы как раз и исследуем профили. Графы связей у нас тоже есть, но для классификации аккаунтов они не нужны. Виды активности мы также используем в качестве фактора для модели. Сбор датасета - это уже решенная задача, наша смекалка помогла намочень сэкономить реурсы при сборе датасета.
Еще раз постараюсь объяснить процесс: мы не пытаемся по тексту комментария определить, является ли аккаунт ботом или нет. Мы классифицируем сам аккаунт с помощью нашей модели определения ботов. Данная модель очень качественно классифифцирует аккаунты. В течение 2020 и 2021 года благодаря этой модели наши клиенты (рекламные агентсва и бренды) смогли оптимизировать свои рекламные бюджеты и не размещать рекламу у тех, кто накрутил подписчиков. Проверенно рынком и бизнесом)

Ответить
Развернуть ветку
Olga Kholodova

Интересная тема.
С одной стороны, да. Все можно заменить ботами, но можно ли заметить человеческое общение? Настоящие эмоции? Сейчас мы погружены в новую реальность, когда процессы автоматизируются и робот может заменять человека во многом, но вряд ли это остановит человека в желании делиться и обсуждать?
Например, в теме «мамочек в декрете» сможете ли вы ботами залить обсуждение выбора детской коляски? Мне кажется, что мамочки будут сильнее ))
Конечно, сейчас есть конфликт поля комментариев и отзывов настоящих и купленных, но если их вообще не пытаться анализировать никак, можно просто открывать газету «Красное знамя молодежи» и получать инфо оттуда. Прогресс не остановить, тем интереснее задача – его возглавить) 

Ответить
Развернуть ветку
Евгения Иванова

Да мы там все реальные , халатное братство - сила🤣

Ответить
Развернуть ветку
John Fima

А в вашем анализе удалены комментарии ботов которых нагнали для унижения и поддержки?  Или вы сканировали все подряд без разбора?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Сегодня часто используют ботов, но в данным случае все абсолютно чисто, проверенно исскуственным интеллектом.

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Среди комментирующих меньше 1 % ботов. Это на уровне статистической погрешности. Все комментарии были сделаны живыми людьми.

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
Еремей Бричкинд

Если платить не за что - это бесплатный комментарий. 

Чушью забили голову про ботов. Это сознательное расчеловечивание народа вокруг. Ты - человек, твои оппоненты - зомби. Их можно жечь. В печах.

Замечу, что этим занимается исключительно оппозиция. 

Кому нахер нужна эта меган-хуеган, чтоб тратить на неё ресурсы. 

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Ваш вопрос понял, спасибо за уточнение. К сожалению, проплаченные комментарии нейросеть на текущий момент не может отделить от комментария, сделанного от чистого сердца. Будем работать дальше и развивать технологии. 

Ответить
Развернуть ветку
Евгения Иванова

Все бесплатно ,от души душевно в душу🤣 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Мы показываем возможности искусственного интеллекта на примере, который в данный момент интересен многим – люди смотрят Олимпиаду и болеют за спортсменов. Таким образом, мы хотели продемонстрировать, что ИИ способен оценить и такой частный случай - имидж одного спортсмена, и бизнес, продукт - в динамике

Ответить
Развернуть ветку
Еремей Бричкинд

айбиэм с гуглом до сих не могут создать ИИ, а вы смогли!! ура, как бы

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Если следовать этой логике, то можно не создавать телефон, потому что уже есть эпл, можно не открывать фермерский магазин у дома, тк есть крупные сети, можно не печь пирог, тк не будет ничего вкуснее бабушкиного из детства.
А можно просто работать и ставить новые задачи. Мы работаем.

Ответить
Развернуть ветку
Еремей Бричкинд

можно не врать тут, приплетая всюду ИИ

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Можно, поэтому мы не врем. Также можно не теоретизировать, а протестировать возможности нашей платформы. Это, кстати, бесплатно

Ответить
Развернуть ветку
Еремей Бричкинд

можно еще заставить себя узнать отличие ИИ от нейронок, т.е. от статистики + алгоритмы

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Игорь Кольцов

С Москвой что-то не то

Ответить
Развернуть ветку
Еремей Бричкинд

она отличается от москвы на эхе москвы?

Ответить
Развернуть ветку
Игорь Кольцов

Что такое эхе москвы? Я не москвич

Ответить
Развернуть ветку
Еремей Бричкинд

это ум, честь и совесть говна нации

Ответить
Развернуть ветку
Игорь Кольцов

Вы перепутали, это оказывается радиостанция, которая принадлежит холдингу Газпром-медиа. А холдинг Газпром-медиа принадлежит Газпромбанку. А Газпромбанк принадлежит газпромовским дочкам, ВЭБ.РФ и другим патриотическим организациям. 100% привилегированных акций принадлежит вообще Российской Федерации. Газпром это национальное достояние, господин Миллер патриот, а Российская Федерация это сверхдержава. Кого вы гавном обозвали из них?

Ответить
Развернуть ветку
Еремей Бричкинд

вы перепутали насравшего с его говном.

обозвал не я, а ленин

Ответить
Развернуть ветку
Игорь Кольцов

А выехали к вам, а не в мавзолей

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Мы анализировали все гео чекины всех комментирующих людей за последние 3 месяца. В итоге получили рейтинг популярных городов среди тех, кто оставлял комментарии. Россияне многие бывали в Москве за последние 3 месяца.

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

«Почти никто не публикует негатив» - это не количественная мера. На данном примере мы увидели, что негативных комментариев действительно оказалось меньше, людям в спортивной тематике захотелось поддержать своих спортсменов, а не принижать других.
Если рассматривать другие области, например, медицину, картина может быть противоположной.

Ответить
Развернуть ветку
Roman Kuvshinnikov

Немного забавно наблюдать, как толпы людей заняты комментированием постов в инсте, которые их "оскорбили" или ещё чего. А потом ещё на основе этих комментариев бренды делают выводы и строят свои стратегии. На мой взгляд тем, кто активно комментирует подобные высказывания и вступают в полемику откровенно нечем себя занять) А уж брендам точно не стоит на основании этой небольшой выборки делать выводы. Мне в первую очередь обидно за наших спортсменов, которые всю жизнь готовились к этим соревнованиям и не смогли на них выступить. Оч круто, что некоторым из них дали эту возможность. Все же это вопросы политики, и я считаю что обычные люди (не замешанные напрямую в этом процессе) не должны страдать от того, что наверху там не договорились. 

Ответить
Развернуть ветку
Евгения Иванова

А Вам ,как , человеку ,который комментирует тут ,есть чем себя занять ?  ))

Ответить
Развернуть ветку
Roman Kuvshinnikov

Да, мне есть чем себя занять). На этом ресурсе я провожу время для того, чтобы обсуждать технологии, развитие индустрии и их влияние на социум и экономику (а не политические скандалы и интриги). И меня интересует реакция и мнение только тех пользователей, кто умеет аргументированно высказывать свою точку зрения и пользоваться знаками препинания.  

Ответить
Развернуть ветку
Евгения Иванова

Однако не оставили без внимания людей ,которые обсуждают это ,но не обсуждают то,что обсуждаете Вы))  ну а знаки препинания-это вечная тема у многих  ,когда хочется что-то сказать ,но сказать нечего)  я бежал за Вами 3 дня ,чтоб сказать ,что Вы мне безразличны (с) 

Ответить
Развернуть ветку
Denis

Искусственный интеллект развился достаточно чтобы убежать за границу блока )

Ответить
Развернуть ветку
Philipp Shayzhanov
Автор

Да, в адаптивной версии есть, что пофиксить, над чем мы работаем. Спасибо, что обратили внимание, как говорится, вы помогаете нам стать лучше ;)

Ответить
Развернуть ветку
Еремей Бричкинд

Поздравительных телеграмм императору Японии, по поводу победы над Россией, россияне уже не пишут, как писали в 1905. Многим это не нравится, да. 

Зато белорусы удивили с поддержкой Тимановской. Одним народам дано иметь своё государство, другим - нет. Они свою страну продают за цивилизованный фантик или за слезинку ребёнков. Значит и не нужно оно им.

Ответить
Развернуть ветку
Демид Московский

Точно, уж какая страна у белорусов? Область в составе РФ – да, но страна? 

Ответить
Развернуть ветку
43 комментария
Раскрывать всегда