Anatoly Kruglov

+32
с 2025
3 подписчика
1 подписка

Если вы следили за миром больших языковых моделей (LLM), то наверняка слышали про RLHF — дообучение с подкреплением на основе человеческой обратной связи

Считается, что RLHF улучшает «полезность и безвредность» модели. Но команда исследователей из Meta, UCL и Оксфорда задалась вопросом: как RLHF влияет на две критически важные, но плохо изуче…

1
3

В современном мире аналитика данных становится все более актуальной для профессионалов в различных областях, включая медицину, социологию, психологию, маркетинг, и т.д.. Тем не менее, многие специалисты сталкиваются с трудностями при попытке применять статистические методы и инструменты анализа. Им часто не хватает специализированных знаний в матем…

24
5