Andrey Tatarinov

+13
с 2018
0 подписчиков
26 подписок

Стек и подход к MLOps зависит от области.

Стек:
- CV/NLP - Pytorch, Huggingface transformers, Mmdetection, Torchvision. (еще был болезненный опыт с TF Detection API :))
- чатботы - RASA и NLU модели HF transformers через обучалку RASA или собственные.
- табличный ML - XGBoost и опять же эксперименты с трансформерами
- recsys - разные матричные разложения типа ALS и трансформеры :)

Деплой:
- если делаем как хотим, то K8s + KServe
- если надо попроще, то самописный сервис с API под задачу

4

Пока нет, сейчас мы ориентируемся на сопровождение процесса нашими инженерами.

У нас есть в планах выставить в интернет демо-версию категоризации, но решили начать со статьи :)

Если вдруг интересует проверить применимость подхода к вашей задаче, напишите, пожалуйста, на hello@epoch8.co

1

Андрей, напишите, пожалуйста, на hello@epoch8.co с деталями вашей задачи (объем базы, предполагаемый размер категорийного дерева, есть ли у вас модераторы), и мы вам обязательно ответим!

Илья, так в этом и смысл, что описанный процесс - это Active Learning, процесс настроен на сбор большего количества данных именно в тех категориях, где данные неоднозначны и модель ошибается.

Даже если изначальные данные плохие (что как правило и бывает), процесс итеративной доразметки приводит к построению сбалансированной обучающей выборки.

1