Из-за того, что процесс майнинг в книге делается из достаточно хорошо структурированных логов (хотя там есть глава про сложности с подготовкой данных, но все же это не UGC), применить эти алгоритмы напрямую не получится. Сначала придется научиться структурировать текстовые данные при помощи LLM. Но, к счастью, на arxiv уже есть несколько статей как это делать.