Отдел кредитных рисков ежедневно анализировал тысячи новостей — мы заменили его моделью машинного обучения

И сократили затраты на сотрудников в 40 раз.

Отдел кредитных рисков ежедневно анализировал тысячи новостей — мы заменили его моделью машинного обучения
1717

Спасибо, интересно!
Не совсем понятен процесс сбора первичной семантики. Ведь для того, чтобы ии начал обучаться различению важных и неважных новостей, ему нужно скормить словарь важных и неважных ключевых слов. Правильно? Если да, то по каким принципам это словарь составляется?

Ответить

У меня например сейчас собран датасет в текстовом виде. Задача отсеять 95% шлака. Я бы с радостью автоматизировал отсев (например, руками профессионалов в ии), но для этого алгоритму нужно как-то объяснить что шлак, а что нет.

Ответить