Telegram объявил конкурс на разработку алгоритма для ранжирования новостей Статьи редакции
Ранее Павел Дуров говорил о планах создать агрегатор новостей внутри мессенджера.
Мессенджер Telegram объявил конкурс для разработчиков, которым предстоит создать алгоритм для ранжирования новостей. Условия конкурса и задачи на русском языке можно посмотреть на сайте конкурсов Telegram.
В частности, алгоритм должен будет уметь выделять англо- и русскоязычные тексты, оставлять в списке только новости, группировать новости по темам. Также среди задач — группировка похожих новостей в сюжеты и ранжирование сюжетов.
Участники должны выполнить и прислать задания боту @jobs_bot в Telegram до 2 декабря 2019 года. Авторы лучших работ разделят призовой фонд в размере $100 тысяч и смогут поучаствовать во втором этапе конкурса с фондом ещё на $100 тысяч.
Летом 2019 года основатель Telegram Павел Дуров пригласил в команду разработчиков «Яндекса», работающих над «Новостями» и другими сервисами рекомендаций контента. По его словам, компания сможет создать подобные сервисы рекомендаций новостей в глобальном масштабе. Дуров пообещал разработчикам отсутствие политической цензуры и зарплату выше, чем в «Яндексе» и Google.
Лучше ничего не придумали еще. Где я могу забрать свои $100к?
Вы скачали? Покажите, расскажите, что архив из себя представляет.
С помощью комментариев накодишь победный алгоритм?
Разумеется, что нет. На трубе инет еле ползет. Просто очень любопытно в каком виде исходные данные.
html в папках на разных языках.
Для начала пусть добавят группировку чатов!
Я уже не знаю как это всё разгрести.
Да не добавит он группировку чатов. Очевидно же, что группировка чатов будет удобна пользователям. Но также очевидно, что эта группировка неинтересна Telegram, потому что в этом случае пользователи намного реже будут заходить в раздел каналов, у тех, в свою очередь, снизятся охваты, что приведёт к потере интереса в этом направлении... И так далее, по цепочке. Ну не выгодно это Telegram, хотя выгодно пользователям этого мессенджера. А поэтому не ждите. Скорее - появится другой мессенджер-конкурент, который это сделает, чтобы выгодно выделиться.
Будет в таком случае хороший ход сделать так, чтобы каждая группа каналов объединялась в новостную ленту и вуа-ля, я имею несколько новостных лент по категориям. И никто тогда не потеряет, а наоборот приобретет
Так а что из себя будут представлять эти новости? Думал как раз, что каналы (в большинстве своем информационные) мигрируют в новости, вот и разделение
Я не про новости, а про возможность группировать сообщения. Например, группа каналов и группа сообщений от людей. Люди давно это просят, потому что им неудобно выискивать сообщения людей между сообщениями каналов.
А я подумал, что новости это и просто новости и что если если в Телеграм запихнут новости, то обычные каналы лишатся аудиторий.
А я представил как агрегатор постов из различных каналов по определённым темам. Шаг в сторону твитора, если хотите
В принципе, требований к миру всего три:
1. Группировка чатов в телеге
2. Сменяемость власти в России
3. Тёмная тема на vc.ru
Комментарий недоступен
Комментарий недоступен
я вот докер не знаю, но смог собрать свой образ для какого-то конкурса. По мне так лучше собрать образ докера, чем разбираться как же там делать deb пакеты.... под 10-кой....
Предлагаете ребятам, которые по причинам безопасности не используют внешние зависимости, неизвестный докер образ у себя смонтировать?)
Комментарий недоступен
Даже в сторонке у них уйдет нерациональное количество времени, чтобы разобрать докер образ. И нужно как-то решать проблему веса образов.
Не знаю, может быть я ошибаюсь, но докер больше про быстрое развертывание, чем про тестовые задания.
А на счет шифрования – скорее всего так и есть)
Комментарий недоступен
Николай его не осилил.
Комментарий недоступен
Если кто-то разработает эффективный алгоритм ранжирования новостей, то он будет стоить сразу от миллиарда $$$. $100K за такую работу давать, совсем как-то по жлобски.
сам алгоритм стоит дешевле. а вот платформа - да, будет стоить миллиарды.
но разработать платформу и поставить на рельсы в 10 раз сложнее и затратнее. плюс не всякому приложению новостному подойдут эти алгоритмы и они будут готовы заплатить 100к$.
думаю предложение разумное, а если нет, то рынок подскажет!
То есть парсить новости умеет. Дальше нужно распарсенный архив (архив не качал, данные не видел) очистить, выделить текст, найти релевантный, соединить вместе почистила смысловые дубли и прочее, сделать заголовок и так на двух языках расположив по ранжиру. И чтобы это было читалось как Шекспир под окном любимой. Написать приложение. Да за полторы недели. Фигня вопрос. А потом этот алгоритм продать 10 раз - Профит. Такие конкурсы можно каждую неделю проводить.... Хм...мысль
Сделал алгорим, продал Дурову за $100K, потом Яндексу за $300K, потом Сбербанку за $2M, затем FB за $30M, потом Microsoft за $1.5B. Профит.
Комментарий недоступен
Требования конкурса и сроки неадекватны. Лучшие бы сузили конкурс на одну конкретную nlp задачу. Хотят все в одном флаконе и за спасибо)
Как разработчик я потратил годы на исследования и на разработку алгоритмов классификации контента и создал классификатор текста на 2000 категорий. Обучать ИИ модели на общие тематики типа наука или политика не сложно, но как только встаёт вопрос отделить в медицине онкологию или еще более узкое направление - сразу начнётся проблемс с исходными данными для обучения. Быстро и качественно это не про nlp.
Проблематика анализа и классификаций текста не вписывается в машинное обучение в виде одной command line программки, которую требуют написать за две недели, которая замкнута на себя и должна очень очень быстро работать, типа как word2vec. Тупиковая идея.
Качественный классификтор это целый комплекс разного ПО, много быстрого железа и рукотворных баз данных, который нужно как оркестр объединить и дирижировать. Должно быть еще видение его развития, а в этом нужна очень сильная любовь и страсть к этому направлению деятельности. Поскольку нужно пройти очень много рутины своими мозгами.
Даже имеющиеся открытые алгоритмы на github можно целый год интегрировать и тестить только, а на выходе среднячок по качеству будет. На продакшн с трудом пойдёт.
Пускай сначала деньги вкладчиков вернёт
ишь ты! развивает телеграм на собственные деньги!
Привлёк он куда больше, чем у него своих, институциональщики подождут, а когда забирать задумают уже и срок пройдёт
Дуров красавчик, он дает возможность молодым показывать себя и зарабатывать деньги!
Комментарий недоступен
Ищет дураков
Интересно, какие там успехи?
Комментарий удален модератором
А потом у них ляжет API, которое саппорт будет лечить 3 дня :( приятного конкурса ахах