#Функция

Web Parsing. Основы на Python

Рассмотрим еще один практический кейс парсинга сайтов с помощью библиотеки BeautifulSoup: что делать, если на сайте нет готовой выгрузки с данными и нет API для удобной работы, а страниц для ручного копирования очень много?

0 показов
113K открытий
Сбор и анализ данных в соц.сетях с API и NLP

Миллионы пользователей сами выкладывают огромное количество информации о себе. По статистике, люди предпочитают говорить о себе правду, так что в каком то процентном соотношении можно доверять информации изложенной на страницах пользователей. Получить доступ к этой информации можно через API.

2 показа
4.8K открытий
Pavlov. Deep Pavlov. Или как определить «эмоциональности» в обращениях клиентов?

Сегодня мы покажем, как с помощью инструмента DeepPavlov обучить классификатор для определения наличия «эмоциональности» в обращениях клиентов.

2 показа
3K открытий
API и ФССП: как это работает?

В рамках профессиональной деятельности у меня часто возникает задача получения данных об исполнительном производстве (ИП) в отношении физических лиц с сайта ФССП.

16 показов
2.9K открытий
Как найти однотипную информацию в большом количестве файлов, используя Python?

Недавно мы решали следующую задачу – необходимо найти и удалить содержащие номера карт файлы, размещенные на общем ресурсе. Если нужно было бы искали что-то, определенное и однозначное, мы могли бы воспользоваться поиском в самой операционной системе (используя стандартны поиск текста в содержимом файла). Но, как правило, поиск стандартными…

5 показов
2.2K открытий
Многопотоковая обработка файлов

В работе по анализу данных иногда требуется обработать большое количество файлов, настолько большое, что обработка может занять неделю, другую. В этой статье вы познакомитесь с многопоточностью в Python и как я решал проблему обработки большого количества файлов.

11 показов
2.2K открытий
Распознавание круглых печатей

Бузинов Игорь, специалист в области Data Science поделится опытом применения преобразования Хафа для поиска окружностей на страницах сканированных документов.

785 показов
2.2K открытий
Точный адрес, пожалуйста

Многие аналитики данных сталкиваются с задачей распознавания адресов, напечатанных на документах.

21 показ
2.2K открытий
Определяем принадлежность объектов к зоне вечной мерзлоты с помощью GeoPandas

Как GeoPandas поможет определить принадлежность объектов к зоне вечной мерзлоты.

3 показа
1.6K открытий
АВИТО КРИК ДУШИ ПОРА ВВОДИТЬ ЭТУ ОПЦИЮ

В НАШЕ НЕПРОСТОЕ ВРЕМЯ НА АВИТО КРОМЕ РЕАЛЬНЫХ ПОКУПАТЕЛЕЙ/ ПОЛЬЗОВАТЕЛЕЙ ЗАЧАСТУЮ ЗА ПРОФИЛЯМИ МОГУТ СКРЫВАТЬСЯ В ЛУЧШЕМ СЛУЧАЕ ТЕ, КОМУ ЗАНЯТЬСЯ НЕЧЕМ (#хулиганы ), В ХУДШЕМ СЛУЧАЕ #МОШЕННИКИ , ПРИКИДЫВАЮЩИЕСЯ ПОКУПАТЕЛЯМИ. По факту такие пользователи так как не является покупателями, могут нести опасность и угрозу не только для товара, но…

1 часть диалога с «Максимом» 10 слайдов скринов
1.7K показов
1.3K открытий
Многопоточная дешифровка и транскрибация записей телефонных переговоров системы NICE

В этой статье мы хотим познакомить читателей с опытом применения продукта от компании NICE Systems - системой NICE Interaction Management. Данная система обеспечивает тотальную запись разговоров, экранов и всех сопутствующих CTI-данных работы операторов контактных центров. По завершению разговора с оператором система позволяет клиенту дать…

17 показов
343 открытия
Как найти дубликаты изображений с использованием Computer Vision?

В данной статье мы расскажем, как можно выявить FRAUD сотрудников, проведя анализ полученных изображений документов, приложенных к авансовым отчетам, с помощью Computer Vision.

10 показов
304 открытия
Создаем свой датасет с пришельцами
2 показа
167 открытий