Скрипт на Python для автоматического составления списка запрещенных площадок в РСЯ
Привет всем! Часто возникает необходимость быстро составлять списки некачественных и фродовых площадок (DSP, game, com и др.) в рекламных кампаниях. Каждый раз делая аудит для вычисления доли потраченных денег на них или при обновлении списков площадок, хотелось бы первое — получить список максимально быстро, второе — сортировать их по расходу, так как с точки зрения ограничений на 1000 площадок туда должны попасть только самые объемные. На рынке уже существуют расширения для браузера, но это все равно нужно заходить постранично, у меня столько времени, к сожалению, не нашлось.
Предупреждение: не надо писать, что лиды с данных площадок есть и исключать их не надо, в 99,9% там фрод, просто откройте сквозную аналитику.
В итоге, не долго думая, вооружившись deepseek, написал скрипт, который позволяет это реализовать.
Предпоготовка (будет в каждой статье)
1. Заходим на https://www.python.org/downloads/release/python-3132/ и скачиваем версию Python.
2. Далее скачиваем PyCharm — https://www.jetbrains.com/pycharm/download, нужно скачать именно PyCharm Community Edition (она бесплатна).
Смотрим видео — https://rutube.ru/video/private/8f8c4121e4e4191a76fdd6a0e265f6ff/?p=MdEmb144rCNXSHJNIDCKaw (делайте по инструкции и будет вам счастье)
3. Далее нужно нажать в меню выбора проекта на «Open», выбрать папку, содержащую скрипт, и нажать на кнопку «Trust project».
4. Если при выполнении вдруг выдает ошибку «no module», нужно перейти в терминал в PyCharm и использовать команду «pip install библиотека» (выдаст многовероятно) — сейчас решается через инсталляцию пакета прямо в терминале, даже команды вводить не надо, просто нажмите на инсталляцию пакета.
5. Также, иногда, будет требовать pkg_resource. Но это решается через установку pip install setuptools.
6. Запускать скрипты нужно через нажатие на иконку запуска, предварительно откройте исполняемый файл .py.
Во всех остальных случаях используем DeepSeek для решения любой из ошибок. Скидываем скрипт, скидываем ошибку и получаем ответ.
Сам скрипт
Скрипт состоит:
- input.csv — файл, состоящий из столбцов: «Площадка» и «Расход», разделенные через ; (удобно можно выгружать из нового мастера отчетов).
- output.csv — список фрод-площадок, отсортированных по расходу.
- script.py — сам скрипт, обрабатывает выгрузку площадок по расходам и формирует список площадок в порядке убывания расхода.
Разберем логику скрипта:
Все, что вам понадобиться в работе это строки:
1. Тут формируем список масок для поиска, ищет по вхождениям, и список можно корректировать, просто добавьте ‘значение’ через запятую — “,”.
2. А это то, что лучше не исключать, так у этих ресурсов есть мобильные приложения которые в целом дают неплохого качества трафик.
Алгоритм работы со скриптом:
1. Скачать выгрузку по расходу и площадкам с нужных кампаний.
Выгрузите из нового/старого мастера со следующими настройками:
Предобработайте отчет: уберите итого, 3 строки сверху, и столбец с названием площадок Яндекс.
Сохраняем в csv, utf-8, разделитель — запятая.
2. Сделать предпоготовку выше.
3. Скачать файл со скриптом https://disk.yandex.ru/d/tBnRna29pbUmUw.
4. Переносим файлик с переименованным названием на input.csv в папку скрипта (простое перетягивание). Переименовываем (в случае если вы выгружаете из нового мастера отчета первые столбцы — можно открыть прямо в Pycharm). Должно быть — «Площадка»; «Расход (руб.)».
5. Запустить.
7. Результат получите в файле output.csv. Копируйте, вставляете в любую таблицу и применяете текст по столбцам с разделителем «;».
На этом всё, получаем список из 1000 самых расходующих площадок и добавляем в РК.
Ставьте лайки, делитесь, подписывайтесь на блог. Успехов!