Александр, спасибо за вопрос! Нам очень нравится площадка vc.ru, ее функционал, обратная связь от читателей, профессиональная аудитория. Будем очень рады, если кейсы и статьи, которые мы тут публикуем, будут полезны для аудитории vc.ru.
При написании данной статьи не стояла цель обучить кого-то. Цель была рассказать, как можно подготовить данные для дальнейшей работы, и поделиться своим опытом. Простейшие преобразования данных были опущены при написании статьи, так как с ними может разобраться каждый. Мы учтем Ваш комментарий касательно подробности изложения информации на будущее.
Arthur Niazyan, спасибо за вопрос, статью мы писали для тех, кто совсем не знаком с СУБД (и не является продвинутым IT-специалистом). Сделали акцент на преимуществах и недостатках. Сейчас в работе чаще используем Hadoop и MS SQL.
Teradata - реже, но и в ней запускаем SQL запросы, зависит от поставленной задачи.
Регулярное выражение re.sub(r’crm[^\n]+’, ’’, c) в данном случае убрало строчку с именем и отчеством. Кроме того, нужно понимать, что в оригинальном коде функция cl_text имела куда больше строк кода, в статье её усеченная версия, чтобы не перегружать статью.
Шестичасовой эксперимент показал, что при работе скрипта средняя загрузка процессора на Raspberry Pi 3 Model B составляет около 44%. Таким образом, более половины ресурсов процессора остаются свободными.
Мы в своих проектах для визуализации аналитики уже 2 года используем Power BI. Удобно презентовать аналитические данные заказчикам.
Планируем перейти Qlik.
Спасибо за обратную связь :)
Что касается энтропии, она не может быть больше 1, т.к. в формуле энтропии используется вероятность, которая сама изменяется в пределах от 0 до 1. Энтропия равная 1, означает полную неопределенность системы, мы с равной вероятностью можем получить элемент системы любого типа.
Артем, к сожалению, исходники в общий доступ выложить не может. Это внутренняя конфиденциальная информация.
Проверяли, где-то ошибка? Подскажите, на каком шаге возникли трудности?
Преимущества raw еще в том, что если чего-то не хватает, то можно установить дополнительные расширения.
NTA
без ТЗ очень трудно работать. В основном можно столкнуться с этим когда у заказчика только идея и проект начинаем с нуля. Тогда можно столкнуться с постоянными "бесконечными" правками.