Telegram объявил конкурс на разработку алгоритма для ранжирования новостей Статьи редакции

Ранее Павел Дуров говорил о планах создать агрегатор новостей внутри мессенджера.

Мессенджер Telegram объявил конкурс для разработчиков, которым предстоит создать алгоритм для ранжирования новостей. Условия конкурса и задачи на русском языке можно посмотреть на сайте конкурсов Telegram.

В частности, алгоритм должен будет уметь выделять англо- и русскоязычные тексты, оставлять в списке только новости, группировать новости по темам. Также среди задач — группировка похожих новостей в сюжеты и ранжирование сюжетов.

Участники должны выполнить и прислать задания боту @jobs_bot в Telegram до 2 декабря 2019 года. Авторы лучших работ разделят призовой фонд в размере $100 тысяч и смогут поучаствовать во втором этапе конкурса с фондом ещё на $100 тысяч.

Летом 2019 года основатель Telegram Павел Дуров пригласил в команду разработчиков «Яндекса», работающих над «Новостями» и другими сервисами рекомендаций контента. По его словам, компания сможет создать подобные сервисы рекомендаций новостей в глобальном масштабе. Дуров пообещал разработчикам отсутствие политической цензуры и зарплату выше, чем в «Яндексе» и Google.

0
36 комментариев
Написать комментарий...
Sergey Khabibullin
SELECT ... ORDER BY publication_date DESC

Лучше ничего не придумали еще. Где я могу забрать свои $100к?

Ответить
Развернуть ветку
Олег Нечаев

Вы скачали? Покажите, расскажите, что архив из себя представляет.

Ответить
Развернуть ветку
Егор Тарасов

С помощью комментариев накодишь победный алгоритм?

Ответить
Развернуть ветку
Олег Нечаев

Разумеется, что нет. На трубе инет еле ползет. Просто очень любопытно в каком виде исходные данные.

Ответить
Развернуть ветку
miteigi nemoto

html в папках на разных языках. 

Ответить
Развернуть ветку
Андрей Андреев

Для начала пусть добавят группировку чатов!

Я уже не знаю как это всё разгрести.

Ответить
Развернуть ветку
Anton Lozovoy

Да не добавит он группировку чатов. Очевидно же, что группировка чатов будет удобна пользователям. Но также очевидно, что эта группировка неинтересна Telegram, потому что в этом случае пользователи намного реже будут заходить в раздел каналов, у тех, в свою очередь, снизятся охваты, что приведёт к потере интереса в этом направлении... И так далее, по цепочке. Ну не выгодно это Telegram, хотя выгодно пользователям этого мессенджера. А поэтому не ждите. Скорее - появится другой мессенджер-конкурент, который это сделает, чтобы выгодно выделиться.

Ответить
Развернуть ветку
Егор Тарасов

Будет в таком случае хороший ход сделать так, чтобы каждая группа каналов объединялась в новостную ленту и вуа-ля, я имею несколько новостных лент по категориям. И никто тогда не потеряет, а наоборот приобретет 

Ответить
Развернуть ветку
Pavel Gor

Так а что из себя будут представлять эти новости? Думал как раз, что каналы (в большинстве своем информационные) мигрируют в новости, вот и разделение

Ответить
Развернуть ветку
Anton Lozovoy

Я не про новости, а про возможность группировать сообщения. Например, группа каналов и группа сообщений от людей. Люди давно это просят, потому что им неудобно выискивать сообщения людей между сообщениями каналов.

Ответить
Развернуть ветку
Huntt Ext

А я подумал, что новости это и просто новости и что если если в Телеграм запихнут новости, то обычные каналы лишатся аудиторий.

Ответить
Развернуть ветку
Camington

А я представил как агрегатор постов из различных каналов по определённым темам. Шаг в сторону твитора, если хотите

Ответить
Развернуть ветку
Camington

В принципе, требований к миру всего три:
1. Группировка чатов в телеге
2. Сменяемость власти в России
3. Тёмная тема на vc.ru

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Kelerius

я вот докер не знаю, но смог собрать свой образ для какого-то конкурса. По мне так лучше собрать образ докера, чем разбираться как же там делать deb пакеты.... под 10-кой....

Ответить
Развернуть ветку
Виталий Воробьев

Предлагаете ребятам, которые по причинам безопасности не используют внешние зависимости, неизвестный докер образ у себя смонтировать?)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Виталий Воробьев

Даже в сторонке у них уйдет нерациональное количество времени, чтобы разобрать докер образ. И нужно как-то решать проблему веса образов.
Не знаю, может быть я ошибаюсь, но докер больше про быстрое развертывание, чем про тестовые задания.
А на счет шифрования – скорее всего так и есть)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Kelerius

Николай его не осилил.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Цой жив

Если кто-то разработает эффективный алгоритм ранжирования новостей, то он будет стоить сразу от миллиарда $$$. $100K за такую работу давать, совсем как-то по жлобски.

Ответить
Развернуть ветку
LETS DO SMTH

сам алгоритм стоит дешевле. а вот платформа - да, будет стоить миллиарды.

но разработать платформу и поставить на рельсы в 10 раз сложнее и затратнее. плюс не всякому приложению новостному подойдут эти алгоритмы и они будут готовы заплатить 100к$.

думаю предложение разумное, а если нет, то рынок подскажет!

Ответить
Развернуть ветку
Олег Нечаев

То есть парсить новости умеет. Дальше нужно распарсенный архив (архив не качал, данные не видел) очистить, выделить текст, найти релевантный, соединить вместе почистила смысловые дубли и прочее, сделать заголовок и так на двух языках расположив по ранжиру. И чтобы это было читалось как Шекспир под окном любимой. Написать приложение. Да за полторы недели. Фигня вопрос. А потом этот алгоритм продать 10 раз - Профит. Такие конкурсы можно каждую неделю проводить.... Хм...мысль 

Ответить
Развернуть ветку
Цой жив

Сделал алгорим, продал Дурову за $100K, потом Яндексу за $300K, потом Сбербанку за $2M, затем FB за $30M, потом Microsoft за $1.5B. Профит.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
miteigi nemoto

Требования конкурса и сроки неадекватны. Лучшие бы сузили конкурс на одну конкретную nlp задачу. Хотят все в одном флаконе и за спасибо) 

Как разработчик я потратил годы на исследования и на разработку алгоритмов классификации контента и создал классификатор текста на 2000 категорий. Обучать ИИ модели на общие тематики типа наука или политика не сложно, но как только встаёт вопрос отделить в медицине  онкологию или еще более узкое направление - сразу начнётся проблемс с исходными данными для обучения. Быстро и качественно это не про nlp. 

Проблематика анализа и классификаций текста не вписывается в машинное обучение в виде одной command line программки, которую требуют написать за две недели, которая замкнута на себя и должна очень очень быстро работать, типа как word2vec. Тупиковая идея. 

Качественный классификтор это целый комплекс разного ПО, много быстрого железа и рукотворных баз данных, который нужно как оркестр объединить и дирижировать. Должно быть еще видение его развития, а в этом нужна очень сильная любовь и страсть к этому направлению деятельности. Поскольку нужно пройти очень много рутины своими мозгами. 

Даже имеющиеся открытые алгоритмы на github можно целый год интегрировать и тестить только, а на выходе среднячок по качеству будет. На продакшн с трудом пойдёт. 

Ответить
Развернуть ветку
Eugene Smirnov

Пускай сначала деньги вкладчиков вернёт

Ответить
Развернуть ветку
Егор Тарасов

ишь ты! развивает телеграм на собственные деньги! 

Ответить
Развернуть ветку
Eugene Smirnov

Привлёк он куда больше, чем у него своих, институциональщики подождут, а когда забирать задумают уже и срок пройдёт

Ответить
Развернуть ветку
Hugo Hug

Дуров красавчик, он дает возможность молодым показывать себя и зарабатывать деньги!

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Sergey Telnov

Ищет дураков

Ответить
Развернуть ветку
Енот Полоскун

Интересно, какие там успехи?

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Треугольный Илья

А потом у них ляжет API, которое саппорт будет лечить 3 дня :( приятного конкурса ахах

Ответить
Развернуть ветку
33 комментария
Раскрывать всегда