Тогда-то я и решил, что Гитхабу не хватает рекомендаций на странице репозитория. Как и в любой другой социальной сети, когда вы открываете какой-нибудь пост, то видите еще кучу рекомендуемых постов или видео для повышения вовлеченности. Я подумал, что было бы неплохо иметь список похожих репозиториев прям на странице репозитория.
Ну вощето нужные репы гуглятся.
Если репа рабочая и как следствие - популярная , она в топе выдачи и везде рекомендуется.
Поэтому искать какой-то нонейм не имеет смысла.
Очередное бесполезное решение
Кажется, Вы не поняли смысла расширения
Автор, Вы молодец! Забрал себе в полезности, отличная идея и реализация 🤘🏻
Спасибо!
Такое статьи на хабр бы писать с более подробным описанием алгоритма рекомендаций. На vc не та аудитория)
Почему именно sentence-transformers? Есть какие-то преимущества над другими векторизаторами?
Короткий ответ: я тестил много подходов, текущий выдавал наиболее точные результаты.
Я работаю с сегментацией параграфов (обычно описание и полезный readme это 3-4 коротких предложения). Я начинал с простого word2vec + tf-idf. Потом попробовал doc2vec. Подсказки были релевантными, но мне не нравилось качество. Понятно, что на 100к описаниях (30% которых это мусор) обучить чего-нибудь стоящего не получится, я начал тестить популярные pre-trained модели. Ну и просто начал с самых популярных моделек на HF. SBERT показался по качеству/скорости самым подходящим вариантом, решил остановиться на нем.