Telegram объявил второй этап конкурса на создание алгоритма для ранжирования новостей с призовым фондом €100 тысяч

Участники должны разработать модуль с возможностью отделения новостей от других материалов и объединения статей в сюжеты.

2525

Возможно тупой вопрос, но есть ли различия в подходе при работе NLP/ML для, например, русского/английского/итальянского языков? Т.е., сделав алгоритм и основу для одного языка, много ли нужно телодвижений, чтобы добавить второй язык?

3
Ответить

есть разница в культуре даже в рамках одного языка
То, как пишут новости на Корейском отличается для юга и севера, например

Вряд ли ожидается решение этого вопроса в рамках этой задачи, но если применять обучение с учителем, то желательно подбирать релевантную выборку

4
Ответить

Это детектив... правильный вопрос

1
Ответить