Даже мы поддались искушению и решили попробовать свои силы. Важно понимать, что мы - классические юристы, а никакие не модные датасатанисты (зачеркнуто) датасайентисты, которые немножко научились "кодить". Это важно понимать, чтобы осознать порог входа (недели интенсива вам хватит, чтобы начать). Однако не обойтись без понимания, как работают статистические модели, методы валидации и пр. Работали мы на языке Python, который по праву можно назвать лучшим инструментом для таких задач. Плюс, он комфортен для новичков: огромное коммьюнити, открытый код с множеством библиотек и миллион обучающих курсов и статей. Например, мы активно использовали библиотеку "scikit-learn".
Прикольная идея и подход к выбору кейса тоже прикольный. Вместе с одним специалистом по налоговым спорам ввели ответы под идеальную позицию для победы - машина оценила вероятность победы в 65%, ок.
После этого ввели самые ужасные с точки зрения позиции налогоплательщика ответы - опять 65%. Там точно не генератор случайных чисел под капотом?)
Если бы помимо процентов сервис выдавал какую-то расшифровку рисков или подсвечивал слабые места в позиции - было бы круче.
Но а вообще это здорово. Верю, что скоро все будет работать :)
Это как раз отголоски того, что использовались реальные дела, которые далеки от совершенства. И там точно не рандом) На всякий случай, проценты выводятся под результат - возможно это путает. Т.е. 65% может означать вероятность выигрыша или проигрыша, там палец вверх или вниз обозначает к чему склонилась "судья".
Прям молодцы, решили конкретную задачу без вещаний про AI
спасибо)
А как ваш робосудья будет говорить защите. Дело должно отлежаться. Дело нужно чем-то придавить. Сухо подходите к процессу..... и все такое 😎.
Всё слишком сложно. Вот вам алгоритм который будет работать в России в 99% кейсов:
if обвиняемый in('друг президента', 'силовик', 'чиновник', 'олигарх') {
return NO_GUILTY;
}
else{
return GUILTY;
};