«Инсайт кобот» — инструмент фильтрации сообщений в Telegram-чатах

Буду краток, мне надоело читать бесконечный спам и скроллить тысячи сообщений в чатах, поэтому вместе с командой мы создали решение, которое позволяет читать только интересных людей в Telegram.

Неудобно и долго искать комментарии и новости от экспертов или интересных людей в толще скопленного спама в чатиках Telegram, к тому же это быстро забивает мозги и порой сильно психологически выматывает.

Так как большинство информации я узнаю через Telegram и провожу около 5 часов в нем каждый день, то решил проанализировать вместе с командой интерфейс и провести интервью с пользователями, чтобы оптимизировать под себя наш общий канал получения информации.

1) Клиенты Telegram:

— С тредовой структурой, как в Slack.

— С возможностью прочтения всех комментов человека в одном месте, как в Twitter.

— С возможностью читать все сообщения от одного пользователя в том же чате, как в Telegram X.

— Который предоставляет возможность создать в чатах отдельную комнату для живого обсуждения конкретной темы.

— Алгоритм которого подстраивался бы под тебя и предоставлял только интересную тебе информацию.

2) «Хранители знаний» с профессиональной FOMO-деформацией в чатах Telegram.

3) Закрытые, профессиональные, приватные, платные чаты — очень узкоспециализированные.

4) Дайджест чата, который делает либо алгоритм запилиленный человеком со своими когнитивными искажениями, либо модератор со своими когнитивными искажениями.

5) Нейроинтерфейс

«Текст, который тысячелетиями был универсальной формой передачи информации, стремительно уступает различным визуальным сущностям. Даже самые стойкие любители высокого слога не заметили, как гифки вытеснили голосовые (хвала!) и смайлы. А потом и саму речь: вместо тысячи слов мы стали коммуницировать анимированными изображениями».

Но будущее за новым форматом адаптации — феноменологическим, интуитивным способом получения полезной информации минуя всевозможные костыли в виде экранов

Параллельно мы проводили интервью с пользователями и в ходе исследования выяснили, что 99!? спама генерят люди, которых не интересно читать, они не являются для них экспертами. Комментарии 1!? экспертов спрятаны в толще от 500 до 2000 сообщений, которые генерируются каждый день.

Во-вторых, выявили, что когда люди переходили к чату с накопленными 2000+ сообщений, то вначале испытывали микрострах, а потом принимали решение — либо мучиться, скипать и упускать сообщения от экспертов, либо читать и убивать часы времени.

Ни один из найденных инструментов не решал нашу проблему, а касдев подтвердил уже ставшую привычной боль у пользователей Telegram.

Поэтому вместе с командой решили принести пользу и за недельку запилили свой первый прототип, который позволил автоматизировать скроллинг и фильтровать тонны мусорной информации, для того, чтобы разгружать наши мозги, экономить драгоценное время, извлекать инсайты от интересных людей и быть в тренде.

Добро пожаловать в мир фильтров.

Все очень факен изи.

Мы еще находимся в самом начале пути и это здорово. Дальше — больше!

Наша стратегическая ставка — способствовать развитию глобальной русскоязычной экосистемы Telegram, нашей самой большой и перспективной национальной компании.

Более того, Telegram — самое большое русскоязычное сообщество. А комьюнити — это новый социальный лифт двадцатых для талантливых молодых людей, пришедший на смену иерархическим структурам. Поэтому в эпоху «экономики сообществ» мы намерены способствовать развитию Telegram в самую любимую и удобную платформу для русскоязычных сообществ и сообществ всего мира.

Антон Белозеров — чемпион в ML WorldSkills 2019. С ним мы познакомились через OpenLand, сообщество Mesto, co-founder. Telegram @wifelly

Илья Поселеннов — челябинский питанист, co-founder. Telegram @iparinile

Александр Овчинников — со-основатель комьюнити «Корпус», co-founder. Telegram @sashovchinnikov

И я – автор текста, Степа Пелевин. Мне 18 лет, я тот самый russian hacker, геймер и стартапер. Недавно я взял gap year в учебном заведении, специально, для того чтобы материализовать все свои идеи и создать продукты, которые любят миллиарды людей по всему миру. Telegram @playAgaain

Давайте дружить! Я очень люблю общаться со всеми в социальных сетях. Думаю, что зарегистрирован везде, где только можно, поэтому пиши, с удовольствием отвечу на вопросы.

И, пожалуйста, напишите свой фидбек и задавайте любые вопросы, моя команда будет очень рада ответить на них.

Ну и обязательно добавляйте кобота в свои уютные чаты и пробуйте использовать всю его силу. Смело скипайте накопленный флуд, кобот поможет отфильтровать тысячи сообщений, разгрузить мозги и сэкономить драгоценное время для фокусировки на самом главном. Удачи и да пребудет с нами сила @insights_cobot!

Если звезды зажигаются, значит, это кому-то нужно (Владимира Маяковский). Кому и зачем выгодно, чтоб информация была представлена именно так?
Мысль изреченная есть ложь (Федор Тютчев). Все что говорится и пишется, обязательно имеет целью сокрытие истины. Никогда не принимайте к сведению любую информацию в тексте.
Основным источником информации в любом тексте являются оговорки, ошибки, описки автора (Фройд).
Сопоставляйте источники. Обращайте внимание на все логические противоречия внутри текстов и между текстами различных источников. Старайтесь интерпретировать противоречия на основе известных Вам элементов и свойств контекстов, имеющих отношение к обсуждаемому предмету (Народные аналитики).
Абсолютной истины не существует. В дискуссии мы не ищем истину, а проясняем позиции — как свою, так и партнеров. Такое прояснение полезно для целей выработки адекватных стратегий поведения и повышения адаптивности к окружающей информационной среде (Народный фольклор).

64 комментария

Игорь Колебин

27.08.2020

Данные – это новый мусор.
Объемы данных не дают стратегических преимуществ.
Китай и США сделали ставку на военные приложения ИИ. Причина этого кажется очевидной и политикам, и военным. Все они повторяют мантру из книги «Супердержавы ИИ» Кай-Фу Ли - «В век ИИ, когда данные - это новая нефть, Китай - новая Саудовская Аравия». Но реальность гораздо сложнее. Все далеко не так просто в обретении военного превосходства в ИИ-системах.
Новый отчет CSET не открывает новых истин, а всего лишь резюмирует – объемы данных имеют такое же значение для обретения военного преимущества, как объемы производимого страной мусора.
Кому придет в голову делать вывод о национальном технологическом превосходстве, если страна – мировой чемпион по мусору? А ведь с данными еще хуже, ибо данные грязнее любого мусора.
Отчет резюмирует.
1.
Объемы необработанных данных вообще не о чем не говорят.
2.
Ценность имеют лишь очищенные, преобразованные, маркированные данные, оптимизированные для обучения конкретными алгоритмами машинного обучения.
3.
Коммерческие данные из п. 2, хотя и полезны, но мало актуальны для военного оперативного ИИ. Данные подбираются под конкретные задачи, а ценность коммерческих данных и моделей машинного обучения для военных приложений крайне мала.
4.
Синтетическая генерация данных (типа той, что делал DeepMind для триумфа AlphaZero в настольных играх), будучи сделана с умом, в тысячу крат ценнее, чем горы данных, произведенных 1.4 миллиардом китайцев, звонящих по телефонам и оплачивающих покупки онлайн.
Ключевой вывод в том, что будущее ИИ (и в том числе военного ИИ) не в больших данных.
А политикам, военным (да и бизнесменам) пора понять – «супердержавой ИИ» станет не страна с горами мусорных данных. А страна, что научится превращать их в еду, питье, энергию и стратегическое военное преимущество.
Китай и США в этом пока не сильно преуспели. И в этой игре никто не проиграл, пока никто не выиграл.

Ответить

Александр Овчинников

возможно фэйк, но в тему.

Павел Дуров:

"Самый опасный яд - информационный. От него нет вакцины, проникнув в нас, он убивает нас всю жизнь. Будущее за теми, кто выработает иммунитет к технологическим ловушкам и научится исключать из своей жизни информационные источники с разрушающим сознание контентом"

Андрей Пущев

Попробую объяснить по пунктам:

1. Trash In — Trash Out, тут всё верно.

Если данные по предпочтениям жевательной резинки, и жвачка только клубничная или банановая и каждая покупка размечена обезличенным идентификатором покупателя, то...

Ошибка в 2% по типу жвачки (допустим идентификаторы расставленные верно, что разумеется не так) даёт около 20% уже на сборе 40 данных вроде "жвачных."

Если же типов жвачки не два а сильно больше, и проблемы с индентификаторами и проблемы с хранением и чего там ещё—систематическая ошибка улетает в 50% уже на сборе пары десятков показателей.

1. Конечно да. Но из построения фразы предполагается что единственное предназначение данных: скормить нейронкам.

Это не так, и есть Data Mining, когда можно подослать красивую девушку/парня к известному объекту: "А у вас нет баннановой жвачки? Есть?! О! Моя любимая."

Но для этого и требуется точность. А также возможность быстро достать, и ещё лучше, построить план встречи автоматически то есть компьютером.

1. Тут всё просто: военные системы интересуются не продавцом-консультантом Валентином и даже не дядей Русиком-милиционнером, а вполне определёнными людьми. Это высшие государственные и военные деятели, а также личный состав спецподразделений.

А у них стоят защитные программы не отдающие никакой или почти никакой точной информации и дальше на концентраторах уже сфальсифицированные данные ещё и косячатся.

Всё косячит нельзя, а косячить по 1% населения и ещё 2% чтобы не догадались какой этот 1%—можно!

1. Я не очень понял какая синтетическая генерация данных имеется в виду. Точно не такая что в AlphaGo Zero.

А что нужно: см. выше. То есть автоматические планировщики, генераторы заданий по проверке и скрамблеры.