Mike

+221
с 2020

🫡

1 подписчик
27 подписок

Если инфляционные ожидание выше ожидаемой доходности акций, то рационально эти акции продать в пользу вклада на 18%.

1

Если у кого-то все еще проблема с доступом к официально чатгпт, то есть много сервисов российских. Ну например https://megagpt.ru

Да наверное Whisper юзают какой-нибудь. Прицепить еще pyannote и вообще 1 в 1 будет.

2

Не будет внимания к проекту - им не будут заниматься. Вот и все)

2

Что вы имеете в виду под "векторизовать API"?

если это апач лицензияВот вы и сами ответили на свой вопрос)

3

Все зависит от лицензии)

5

Посмотрел по своим звездочкам, не нашёл в readme альтернатив. Да и не все будут упоминать конкурентов у себя)

5

А мне часто интересно посмотреть альтернативы проектам которые лайкают мои друзья, нахожу что-то интересное

Если вы наткнулись на какой-нибудь прикольный репозиторий или библиотеку, всегда интересно глянуть альтернативы или похожие продукты. Мне лень такое гуглить)

13

Сейчас все происходит именно так, как Вы описали)

1

Спасибо за замечание! Да, в выборке пока 80к+ репозиториев. Будет спрос - добавлю больше. Возможно эти репозитории просто не попали в пулл. Да и в теории можно не ограничиваться на 5 рекомендациях, может добавлю кнопку "показать больше".

1

Изначально статью писал на английском, это был артефакт перевода... спасибо за замечание)

Кажется, Вы не поняли смысла расширения

21

Короткий ответ: я тестил много подходов, текущий выдавал наиболее точные результаты.

Я работаю с сегментацией параграфов (обычно описание и полезный readme это 3-4 коротких предложения). Я начинал с простого word2vec + tf-idf. Потом попробовал doc2vec. Подсказки были релевантными, но мне не нравилось качество. Понятно, что на 100к описаниях (30% которых это мусор) обучить чего-нибудь стоящего не получится, я начал тестить популярные pre-trained модели. Ну и просто начал с самых популярных моделек на HF. SBERT показался по качеству/скорости самым подходящим вариантом, решил остановиться на нем.

13