Для определения индекса были выявлены русскоязычные упоминания «любви» и «ненависти» от первого лица в настоящем времени: позитивные эмоции (например, «я люблю», «обожаю», «я без ума», «я счастлив» и т.п.) и негативные («я ненавижу», «меня раздражает», «бесит», «твит ненависти» и пр.) среди 894 млн публичных постов и комментариев, оставленных российскими пользователями в социальных сетях ВКонтакте, Одноклассники, Instagram, Youtube, TikTok, Facebook, Twitter, LiveJournal, а также на форумах, в блогах и т.д. Период исследования: 28 января – 8 февраля 2021 г. Из анализа были исключены репосты и рекламные публикации. В результате сообщений от первого лица, отвечающих критериям анализа, оказалось 813,5 тысяч.
Интересно как они анализируют саркастичные регионы, типо обожаю наши дороги, или без ума от действий властей.
Александр, спасибо за вопрос. Сарказма в реальности в соцсетях немного, не более процента-двух, в таком объеме он не влияет на результаты. Вопрос про сарказм, его объем и влияние на результат текстовой аналитики достаточно распространен. Особенно когда обсуждается точность тонализации сообщений, для работы которой сарказм также является непростой задачей. Практика такова, что сарказм из-за своего незначительного объема не влияет на результаты ни в том, ни в том случае.
Все это хорошо - И индекс любви и сам любовь, но не понимаю для чего, для каких целей и какая польза от этой статистики. Объясните пожалуйста, интересно.🙂
Комментарий недоступен
Жаль ненцев, счастья им и любви к ненеции