Добавить обложку
Подписан
Отписаться

NewTechAudit

Лайфхаки IT, проверенные AI-решения для стандартных задач

778 подписчиков

Онлайн-вебинар: Анализ отзывов клиентов, размещённых в Интернет. Успей зарегистрироваться!

Как быстро объединить информацию, выгруженную из разных АС, используя SQL?

(Будет полезна для начинающих изучать SQL, рассматриваем пример из практики внутреннего аудитора)

В ходе одной из проверок потребовалась информация по клиентам, содержащаяся в нескольких представлениях АС, то есть необходимо было выгрузить поочередно информацию из различных представлений АС, которую затем следовало объединить для получения нужного результата. Вот здесь и пригодились навыки SQL-запросов. А именно:

Цикл WHILE для выбора данных за период в T-SQL

Зачастую в нашей работе возникает потребность получить набор данных за определенный период. Сделать это можно несколькими способами. В этой статье рассмотрим применение цикла WHILE для задачи поиска расходных операций за несколько месяцев по перечню счетов и сравним его с запросом, в котором весь период будет указан в блоке WHERE.

Как с помощью Pivot агрегировать информацию из множества столбцов?

Иногда в практике можно столкнуться с задачей, когда необходимо получить выгрузку, которая содержит в себе агрегирующую (сводную) информацию по какому-то объекту (сотруднику, клиенту, счету, карте). Для реализации такого подхода можно использовать оператор pivot в T-SQL, который разворачивает столбец в строку, преобразуя уникальные значения этого…

Решаем NLP-задачу – как классифицировать тексты по темам?

Расскажем о подходах, позволяющих создать классификатор, автоматически относящий текст к той или иной категории.

Сегодня нам предстоит описать решение задачи по созданию классификатора текстовых документов. Шаг за шагом мы будем пытаться улучшить нашу модель. Давайте посмотрим, что же из этого получится.

Секционирование таблиц MS SQL

При организации ETL-процессов, может возникнуть необходимость загрузки большого объема данных в таблицы, активно используемые пользователями. При этом, зачастую возникают проблемы с производительностью, связанные с блокировками обновляемых таблиц.Эти проблемы можно решить воспользовавшись возможностями, которые предоставляет механизм…

Повышение качества распознавания сканов документов с таблицами с помощью вычисления координат ячеек

Библиотека распознавания текста tesseract является открытым, безопасным и полезным инструментом в аудите. К сожалению, она пасует при распознавании массивных таблиц на скан образах документов. Рассмотрим как обойти это ограничение.

Предсказываем спрос с помощью нейронных сетей

В этой статье мы хотим поделиться опытом применения нейронной сети MLP с использованием python и библиотеки sklearn в задаче прогнозирования спроса на товар по онлайн-объявлению.

Как искать эффектные видеодоказательства с помощью плагина Saber?

Лучше один раз увидеть, чем сто раз услышать. Как быть, если необходимо обратить внимание аудитории на детали, являющиеся важными аудиторскими доказательствами, а стандартного набора инструментов, предлагаемого различными видеоредакторами, недостаточно?

Рис.1

Как решать задачи Data Mining с помощью Excel?

Что приходит Вам в голову при упоминании «Data Mining»? Наверняка высокая, почти космическая, сложность алгоритмов, непонятные манипуляции с огромными массивами данных, нереальные объемы программного кода с применением множества разнообразных framework-ов с пугающими названиями – одним словом что-то недоступное обыкновенному человеку. Но все ли…

AI ищет залоговое имущество

Что делать, если необходимо сопоставить данные из одной базы данных с любой другой, но четкого уникального ID нет. Как нам поможет в этом искусственный интеллект? Об этом в нашей статье.

Анонимизация данных с помощью Python

Одним из простых способов обезличивания данных может быть использование языка Python. Работать можно с файлами в любом формате, как в текстовом (.csv), так и в формате. xlsx. Мы будем использовать модуль pandas для удобства обработки.

Комментарии