{"id":6525,"title":"\u041a\u0430\u043a \u0441\u0435\u0431\u044f \u0447\u0443\u0432\u0441\u0442\u0432\u0443\u0435\u0442 \u0438\u043d\u0432\u0435\u0441\u0442\u0438\u0446\u0438\u043e\u043d\u043d\u044b\u0439 \u043f\u043e\u0440\u0442\u0444\u0435\u043b\u044c \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u0435\u043b\u0435\u0439 vc.ru","url":"\/redirect?component=advertising&id=6525&url=https:\/\/vc.ru\/promo\/292716-yandeks-vyhodit-iz-spyachki-alibaba-portit-nastroenie&placeBit=1&hash=7519bee6efc23ae5d635bf3098f678add4979d572b9f05b21135900c9688d27b","isPaidAndBannersEnabled":false}

Олимпиада, россияне и нейросеть

Всем привет! Как вы знаете, 23 июля в Токио стартовали ХХXII Летние Олимпийские игры — большой спортивный праздник для болельщиков по всему миру. Участники борются за право стать лучшими, за право попасть в историю. Но соперничество между спортсменами не всегда заканчивается после свистка арбитра и награждения победителя — иногда схватка продолжается в социальных сетях. Нас в Yoloco заинтересовала битва кириллицы с латиницей, которая развернулась в полях Инстаграма под постом Megan Kalmoe – бронзовой призерши Олимпиады 2012 и участницы Олимпиады 2021 года в академической гребле.

Мы решили проанализировать тональность высказываний российских болельщиков и показать возможности искусственного интеллекта в оценке имиджа спортсмена, публичной личности, звезды, человека, бренда в социальных сетях.

Напомню, что произошло.

29 июля 2021 года в Токио россиянки Елена Орябинская и Василиса Степанова выиграли серебро в парном соревновании по академической гребле.

Соперница наших спортсменок Megan Kalmoe написала в своем аккаунте в Твиттере, что ей «неприятно видеть», как россиянки, которые «не должны были участвовать в играх», получили медали.

Твит получил более тысячи комментариев, но наибольшая активность возникла под постом спортсменки в Инстаграм. На аккаунт Megan подписано около 3 тысяч человек, а посты обычно собирают 200-500 лайков и около 30-40 комментариев.

Но после высказывания в Твиттере последний пост Megan в Инстаграм стал стихийной трибуной русскоговорящих пользователей — спортивные болельщики оставили более 12-ти тысяч комментариев с поддержкой российских спортсменов. В течение дня мы проанализировали все.

Что удалось узнать?

Тональность

Проанализировав 12 тысяч комментариев, 73% которых — русскоязычные, наша нейросеть определила среди них:

50% нейтральных комментариев (в данном контексте к ним относятся, к примерунапример, строки из советского стихотворения Орлова, известного многим по фильму "Брат-2".

Я узнал, что у меня Есть огромная семья! И тропинка, и лесок, В поле - каждый колосок.
Речка, небо голубое, Это все мое, родное!

10% — явно негативных.

40% — позитивных комментариев, которые в большей степени относились к слову Россия.

Здесь интересно, что комментаторы достаточно сдержано парировали спортсменке, практически не используя сниженную лексику.

Мы проанализировали 27 тысяч слов — все они собраны в облако.

Детали

Под постом спортсменки комментарии оставили 5302 уникальных пользователя. Почти все профили с небольшим количеством подписчиков и подписок, и только два имеют больше 150 000 подписчиков:

  • https://www.instagram.com/mymilly.ru
  • https://www.instagram.com/zvezdnaiapre

Наиболее активны в комментариях люди в возрасте 25-34 лет — это 69% женщин и 53% мужчин. Что интересно, активно писали комментарии мужчины в возрастной группе 35-44 (37%), в то время как женщин этой возрастной группы тема интересовала значительно меньше (15%). Пол и возраст пользователей мы в Yoloco распознаем с помощью искусственного интеллекта.

Этот график позволяет нам увидеть города, в которых когда-либо чекинились пользователи Инстаграма, оставившие комментарии под постом Megan Kalmoe. То есть если житель Сочи ставил геотег "Москва" на публикации или сторис за все время ведения своего блога, мы увидим эти данные в нашей базе данных.

Другие интересные факты:

  • Среди комментаторов нет ни одного верифицированного аккаунта.
  • 45% владельцев аккаунтов закрыли свой профиль, 55% – оставили свой профиль открытым.
  • Всего лишь 13% владельцев аккаунтов подключили бизнес-профиль, не стали – 87%.
  • 71% комментаторов – женщины, остальные – мужчины.

Также отмечу, что среди комментирующих оказалось много профилей масс-фолловеров. Было даже несколько аккаунтов, у которых больше 7 тыс. подписок.

Кейс

В 2019 году подобный всплеск повышенной активности российских пользователей был отмечен в аккаунте поп-звезды Lady Gaga @ladygaga. Примечательно, что флешмоб под постом знаменитости или «гагачат», как его назвали организаторы и участники – русскоговорящие пользователи социальной сети, стал популярен настолько, что к нему подключились российские звезды. Причиной, предположительно, было то, что Lady Gaga якобы стала яблоком раздора в отношениях актера Брэдли Купера и российской супермодели Ирины Шейк — пользователи пришли поддержать соотечественницу. В итоге пост Lady Gaga собрал более миллиона комментариев.

Делаем выводы

Наглядно видно, что Инстаграм — это площадка для выражения своих чувств, и можно прогнозировать, что такие случаи не останутся единичными.

Инстаграм — это индикатор настроения и отношения людей к тому или иному бренду, количественная и качественная оценка бренда.

Сегодня имидж можно оцифровать, и это то, чем мы занимаемся в Yoloco. Сейчас мы рассмотрели кейс и имидж отдельного спортсмена, и важно понимать, что имидж продукта, компании, бренда также можно измерить и использовать эти данные для выполнения тактических профессиональных задач. Поэтому мы так тщательно работаем с комментариями в социальных сетях — их тональностью и окрасом, применяем методы машинного обучения.

Имидж — это не только комментарии в социальных сетях, эмоциональные оценки и публичные обсуждения, — это перераспределение влияния и лояльность к персоне и бренду, а в денежном эквиваленте — это потенциальные или упущенные рекламные контракты. А для маркетолога эта информация — ключевой инструмент эффективного управления бюджетом и повышения конверсии рекламных интеграций.

{ "author_name": "Филипп Шайжанов", "author_type": "self", "tags": ["\u043e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u0430","\u0438\u043d\u0441\u0442\u0430\u0433\u0440\u0430\u043c"], "comments": 46, "likes": 9, "favorites": 5, "is_advertisement": false, "subsite_label": "social", "id": 276790, "is_wide": true, "is_ugc": true, "date": "Tue, 03 Aug 2021 09:55:18 +0300", "is_special": false }
0
46 комментариев
Популярные
По порядку
Написать комментарий...
Конструктивный крюк
5

Такова реальность )

0

Инстаграм — это индикатор настроения и отношения людей к тому или иному бренду, количественная и качественная оценка бренда.

Это крайне спорное утверждение. Современные технологии позволяют создавать продвинутые бото-фермы.

Сейчас процесс создания "уникальных" комментариев можно полностью автоматизировать. (пример барабоса или как его там от яндекса)
По-этому отличить реальное мнение и отношение  от продвигаемого "маркетолагами" на данный момент фактически невозможно

4

Качественная бото-ферма - это очень дорого и в 99 % случаев проект не будет сходиться по юнит - экономике. Инстаграм умело банит всех ботов. Сейчас выгоднее тратить ботов накрутку лайков и комментариев, но такие боты распознает наша нейросеть. В данном кейсе таких ботов практически нет. 

Проплачивать людям за их комментарии - еще более дорогая история. Тут точно не будет сходиться юнит - экономика. 
Процесс создания уникальных комментариев - это затраты не только на разработку продвинутых NLP - моделей, но и на вычислительные мощности, что опять приводит к юнит - экономике.

Мы пришли к тому, что дешевых ботов распознает наша нейросеть, а дорогие боты просто невыгодны.

1

простое гугление говорит, что комментарий в инсте стоит 1,5-2 руб.

Если уже есть предобученная сеть, то создать 20 000 комментариев будет стоить копейки. ну допустим те же 1-2 руб.

Т.е. бюджет, что бы пульнуть 20 000 комментариев  в районе 1000 USD это бюджет даже не компании, а просто несильно богатого человека с хорошей зарплатой.

п.с. комментарии можно к стати даже не генирировать а тупо спарсить с того же инстаграмма, почистить и будет готовая библиотека. по цене работа тоже на уровне зарплаты за пару дней работы юниора. ред.

0

Мы не поняли друг друга. 
Вы не учитываете тот факт, что комментарии нужно делать с определенного аккаунта. Если это бот, то такой аккаунт вычисляет наша нейросеть, если это аккаунт человека, то это нужно делать руками, смысл пропадает.

0

т.е. у вас есть база всех ботов инсты :)) ? сомневаюсь.
вычислить бота это отдельный трудозатратный процесс.

какое в принципе отношение имеет нейросеть к вычислению бота? Здесь скорее обычное ML и скоринг.

0

ML - машинное обучение, это класс искусственного интеллекта. Давайте тогда договоримся, мы все понимаем, что такое ИИ?) Методы машинного обучения основаны на применении нейросетей. 
Для того, чтобы отнести конкретный цифровой объект (аккаунт Инстаграмма) к одному из классов (бот или живой человек), нужен какой-то механизм, это может быть:
- Тупой алгоритм, например, если больше 500 подписчиков, то это аккаунт живого человека
- Регрессионная модель, которая на вход, например, получает кол-во подписчиков и кол-во постов и потом дает прогноз. Y = a + b*X. Простой и иногда рабочий прием, но не в случае определения ботов, где зависимость результата от факторов сложная и нелинейная
- Простая нейронная сеть (многослойный перцептрон) хороша, когда есть большой датасет для обучения. В нашем случае у нас есть большой датасет: аккаунты живых людей и аккаунты ботов. Также у нас есть более 20 факторов, знаний о каждом аккаунте (текст из шапки профиля, кол-во подписчиков, средняя вовлеченность на посте и тд). Мы выбрали самый сложный, но самый точный способ определения ботов.

Модели и хороши тем, что они показывают на боьших объемах хорошие средние результаты. У нас на объемах 95 % точности и мы ее улучшаем постоянно. 

1

Я имел в виду решение задачи классификации классическими методами без использования нейросетей.

Не думаю, что по количеству подписчиков, постов и т.д. можно вычислить ботов.
Скорее надо исследовать профиль, графы связей и виды его активности, а это трудозатратная в плане машинного времени работа, которая будет стоить кучу бабок за сбор датасетов.

Если же вспомнить про то что появились возможности генерировать любые объемы "нормального" связанный текста требуемого окраса для компьютерного зрения (глазами же это никто проверять не будет), то не думаю что возможно отличить  бота от человека. не исследовав глубоко его посты и совместные действия с другими пользователями.

0

Мы не говорили, что определяем по кол-ву подписчиков, постов только. Есть более 20 факторов, по которым можно классифицировать аккаунт. Мы как раз и исследуем профили. Графы связей у нас тоже есть, но для классификации аккаунтов они не нужны. Виды активности мы также используем в качестве фактора для модели. Сбор датасета - это уже решенная задача, наша смекалка помогла намочень сэкономить реурсы при сборе датасета.
Еще раз постараюсь объяснить процесс: мы не пытаемся по тексту комментария определить, является ли аккаунт ботом или нет. Мы классифицируем сам аккаунт с помощью нашей модели определения ботов. Данная модель очень качественно классифифцирует аккаунты. В течение 2020 и 2021 года благодаря этой модели наши клиенты (рекламные агентсва и бренды) смогли оптимизировать свои рекламные бюджеты и не размещать рекламу у тех, кто накрутил подписчиков. Проверенно рынком и бизнесом)

1

Интересная тема.
С одной стороны, да. Все можно заменить ботами, но можно ли заметить человеческое общение? Настоящие эмоции? Сейчас мы погружены в новую реальность, когда процессы автоматизируются и робот может заменять человека во многом, но вряд ли это остановит человека в желании делиться и обсуждать?
Например, в теме «мамочек в декрете» сможете ли вы ботами залить обсуждение выбора детской коляски? Мне кажется, что мамочки будут сильнее ))
Конечно, сейчас есть конфликт поля комментариев и отзывов настоящих и купленных, но если их вообще не пытаться анализировать никак, можно просто открывать газету «Красное знамя молодежи» и получать инфо оттуда. Прогресс не остановить, тем интереснее задача – его возглавить) 

0

Да мы там все реальные , халатное братство - сила🤣

0

А в вашем анализе удалены комментарии ботов которых нагнали для унижения и поддержки?  Или вы сканировали все подряд без разбора? ред.

2

Боты в вашем уютном мирке, я так понимаю, все, кто не согласен с вашим однопроцентным мнением?

5

Сегодня часто используют ботов, но в данным случае все абсолютно чисто, проверенно исскуственным интеллектом.

0

Среди комментирующих меньше 1 % ботов. Это на уровне статистической погрешности. Все комментарии были сделаны живыми людьми.

1

Причем тут боты? Как отличить обычного комментатора от комментатора за деньги?
Вот за этот комментарий мне может быть заплатили, а может быть и нет...

3

Если платить не за что - это бесплатный комментарий. 

Чушью забили голову про ботов. Это сознательное расчеловечивание народа вокруг. Ты - человек, твои оппоненты - зомби. Их можно жечь. В печах.

Замечу, что этим занимается исключительно оппозиция. 

Кому нахер нужна эта меган-хуеган, чтоб тратить на неё ресурсы. 

2

Ваш вопрос понял, спасибо за уточнение. К сожалению, проплаченные комментарии нейросеть на текущий момент не может отделить от комментария, сделанного от чистого сердца. Будем работать дальше и развивать технологии. 

0

Все бесплатно ,от души душевно в душу🤣 

0

Извиняюсь, но как-то не уловил мотивацию прикручивать ИИ к срачу под постом в инсте) В чём смысл такого действия? Просто для фана? Без обид, пожалуйста) ред.

2

Мы показываем возможности искусственного интеллекта на примере, который в данный момент интересен многим – люди смотрят Олимпиаду и болеют за спортсменов. Таким образом, мы хотели продемонстрировать, что ИИ способен оценить и такой частный случай - имидж одного спортсмена, и бизнес, продукт - в динамике

0

айбиэм с гуглом до сих не могут создать ИИ, а вы смогли!! ура, как бы

3

Если следовать этой логике, то можно не создавать телефон, потому что уже есть эпл, можно не открывать фермерский магазин у дома, тк есть крупные сети, можно не печь пирог, тк не будет ничего вкуснее бабушкиного из детства.
А можно просто работать и ставить новые задачи. Мы работаем.

0

можно не врать тут, приплетая всюду ИИ

1

Можно, поэтому мы не врем. Также можно не теоретизировать, а протестировать возможности нашей платформы. Это, кстати, бесплатно

1

можно еще заставить себя узнать отличие ИИ от нейронок, т.е. от статистики + алгоритмы

0

Уловил, спасибо

2

С Москвой что-то не то

2

она отличается от москвы на эхе москвы?

1

Что такое эхе москвы? Я не москвич ред.

0

это ум, честь и совесть говна нации

1

Вы перепутали, это оказывается радиостанция, которая принадлежит холдингу Газпром-медиа. А холдинг Газпром-медиа принадлежит Газпромбанку. А Газпромбанк принадлежит газпромовским дочкам, ВЭБ.РФ и другим патриотическим организациям. 100% привилегированных акций принадлежит вообще Российской Федерации. Газпром это национальное достояние, господин Миллер патриот, а Российская Федерация это сверхдержава. Кого вы гавном обозвали из них? ред.

0

вы перепутали насравшего с его говном.

обозвал не я, а ленин

2

А выехали к вам, а не в мавзолей

0

Мы анализировали все гео чекины всех комментирующих людей за последние 3 месяца. В итоге получили рейтинг популярных городов среди тех, кто оставлял комментарии. Россияне многие бывали в Москве за последние 3 месяца.

0

"Инстаграм — это индикатор настроения и отношения людей к тому или иному бренду, количественная и качественная оценка бренда."

Сложно согласиться, т.к. в Инстаграме почти никто не публикует негатив, а оценка не может складываться только из позитивных отзывов и их количества.

Если на бренд А нашли больше позитивных отзывов чем на бренд Б - это ничего не значит, так как негативные отзывы и их количество никто не считал, т.к. в Инстаграме их нет. На Бренд А - 100 позитивных, а на бренд Б - 50 позитивных отзывов. Но за пределами Инстаграма на бренд А - 50 негативных отзывов, а на бренд Б - ноль. Какой выбирать? ред.

2

«Почти никто не публикует негатив» - это не количественная мера. На данном примере мы увидели, что негативных комментариев действительно оказалось меньше, людям в спортивной тематике захотелось поддержать своих спортсменов, а не принижать других.
Если рассматривать другие области, например, медицину, картина может быть противоположной.

0

Немного забавно наблюдать, как толпы людей заняты комментированием постов в инсте, которые их "оскорбили" или ещё чего. А потом ещё на основе этих комментариев бренды делают выводы и строят свои стратегии. На мой взгляд тем, кто активно комментирует подобные высказывания и вступают в полемику откровенно нечем себя занять) А уж брендам точно не стоит на основании этой небольшой выборки делать выводы. Мне в первую очередь обидно за наших спортсменов, которые всю жизнь готовились к этим соревнованиям и не смогли на них выступить. Оч круто, что некоторым из них дали эту возможность. Все же это вопросы политики, и я считаю что обычные люди (не замешанные напрямую в этом процессе) не должны страдать от того, что наверху там не договорились.  ред.

1

А Вам ,как , человеку ,который комментирует тут ,есть чем себя занять ?  ))

–1

Да, мне есть чем себя занять). На этом ресурсе я провожу время для того, чтобы обсуждать технологии, развитие индустрии и их влияние на социум и экономику (а не политические скандалы и интриги). И меня интересует реакция и мнение только тех пользователей, кто умеет аргументированно высказывать свою точку зрения и пользоваться знаками препинания.  

0

Однако не оставили без внимания людей ,которые обсуждают это ,но не обсуждают то,что обсуждаете Вы))  ну а знаки препинания-это вечная тема у многих  ,когда хочется что-то сказать ,но сказать нечего)  я бежал за Вами 3 дня ,чтоб сказать ,что Вы мне безразличны (с) 

–1

Искусственный интеллект развился достаточно чтобы убежать за границу блока )

0

Да, в адаптивной версии есть, что пофиксить, над чем мы работаем. Спасибо, что обратили внимание, как говорится, вы помогаете нам стать лучше ;)

0

Поздравительных телеграмм императору Японии, по поводу победы над Россией, россияне уже не пишут, как писали в 1905. Многим это не нравится, да. 

Зато белорусы удивили с поддержкой Тимановской. Одним народам дано иметь своё государство, другим - нет. Они свою страну продают за цивилизованный фантик или за слезинку ребёнков. Значит и не нужно оно им. ред.

–1

Точно, уж какая страна у белорусов? Область в составе РФ – да, но страна? 

0
Читать все 46 комментариев
«Яндекс.Облако» запустит виртуальные рабочие столы для компаний и откроет представительство в Германии Статьи редакции

Об анонсах конференции Yandex Scale vc.ru рассказали в компании.

Нужны ли в России сити-фермы

И появятся ли грядки на крышах пятиэтажек.

re-thinkingthefuture.com
FoodTech: дорого и вкусно!

Как сделать так, чтобы российский бизнес стал одним из лидером в сфере FoodTech? Да все просто – привлечь в него максимум инвестиций и инноваций! Вот вам немного цифр для раскачки: по оценкам J’son & Partners, объем мирового рынка FoodTech в 2018-м году составлял 191 миллиард долларов США, то к 2025-му году он может достичь 390 миллиардов.…

Новый проект «Кофемании» Bez Tarelok представил экологичную упаковку из багассы, полевых трав и «честного» пластика

В августе на Усачевском рынке запустилась кулинария Bez Tarelok от «Кофемании». В новом заведении можно качественно поесть быстрее, чем в ресторане, или взять еду с собой — разумеется, в контейнерах, но теперь биоразлагаемых. Бренд решил сократить использование пластика и частично перешел на упаковку из сахарного тростника — багассы — и травяную…

ФНС разработала законопроект о новом налоговом режиме для малого бизнеса — ставка 8%, не будет страховых взносов Статьи редакции

Для компаний, которые платят налоги по УСН с режимом «доходы минус расходы» предлагают поднять минимальный уровень налога — с 1% до 3%.

Готовимся к техническому собеседованию при помощи чат-бота: проект студентов SkillFactory

Если вы загуглите «как пройти техническое собеседование», найдёте статьи, инструкции, кейсы, а также анекдоты и мемы. И вряд ли отыщете «волшебную таблетку», которая поможет вам и даст все ответы. Мы тоже не нашли — и сделали чат-бота для подготовки к техническому собеседованию. Рассказываем, кто и как его создавал и что получилось в итоге.

Краткая история брендинга: от египетских горшков до iPhone 13

Брендинг появился тогда, когда было два схожих товара. Начиная с отметок мастеров на глиняных горшках, до сегодняшних брендов, создающих имидж и отношения с покупателями. К сожалению, мы пройдемся только по верхам тысяч лет: иначе это была бы не статья, а целая книга. А мы не издательство, мы дизайн студия.

Символы кузнецов и ремесленников 15-17 веков, из книги Symbols, Signs and Signets Эрнста Ленера
Ozon запланировал запустить онлайн-кинотеатр — «Ъ» Статьи редакции

На запуск может уйти около $100 млн, считают эксперты.

Google Ads опять вносит изменения в работу типов соответствия ключевых слов

Адаптированный перевод с комментариями Александра Хитро вышедшей 23 сентября статьи из Справки Google Ads и пока не переведенной на русский язык.

Что такое сложный процент. Рассказывает персональный брокер

Персональные брокеры помогают разобраться, как сформировать долгосрочный портфель и не отвлекаться на новостной шум. Сегодня поговорим о сложном проценте, который поможет инвестору получить больше от своих инвестиций.

Старинный пруд в Москве очистят при помощи водной мяты

Систему природной очистки воды при поддержке крупного французского фитокосметического бренда презентовали в Ботаническом саду МГУ «Аптекарский огород». Рассказываем, как устроена технология и в чем выгода использования растений.

фото: пресс-служба "Аптекарского огорода"
null