Раз уж мы заговорили о том, что документ может состоять из нескольких полей, то давайте рассмотрим ещё один важный фактор - вес поля. В Sphinx он обозначается как user_weight (integer). Веса для каждого поля присваиваются самим пользователем при настройке поискового движка. Что это значит? Если мы, например, уверены, что нахождение запроса в названии книги в 100 раз круче, чем нахождение его же в тексте книги, то прописываем вес поля для названия 100, для текста книги 1.
Сильно!
Пойдёте к нам в Авито работать?
Снова? :)
Отличная статья! Для интересующихся - чуть глубже про TF-IDF на пальцах https://manticoresearch.com/2019/04/23/tf-idf-%d0%b2-%d0%bf%d1%80%d0%b8%d0%bc%d0%b5%d1%80%d0%b0%d1%85/
А это точно Chief Product Officer а не системный аналитик?
Комментарий недоступен
Зачем вводить термин "пертинентность" если есть устоявшееся "соответствие интенту" или "соответствие намерению пользователя"?