В процессе любой работы периодически возникает необходимость выгрузить обрабатываемую в программе информацию, для её хранения или дальнейшей передачи. При этом важно не утратить информацию или её часть, и быть уверенным, что тот кому файл будет передаваться сможет с ним работать. Подобный процесс и называется сериализацией данных.
Не так давно появилась новая библиотека PandasAI, и сегодня я, Горюнов Дмитрий расскажу о ней. PandasAI подход к анализу данных с помощью привычной нам библиотеки Pandas. Принцип работы библиотеки заключается в том, что пользователь при работе с датафреймом не пишет код, а естественным языком делает запрос по своим данным и получает ответ.…
В Excel есть команда, которая называется Камера, ее нужно принудительно добавлять на ленту. С помощью этой команды можно делать снимок с диапазона на листе Excel, выбранной части таблицы данных и помещать его на другой лист этой книги.
Область применения команды Камера огромна. На мой взгляд, использование данной команды — это простой способ визуализации результатов, и их интерпретации, полученных по итогам обработки данных из автоматизированных систем, а также создания панели индикаторов процессов.
Совсем недавно у меня появилась интересная задача – необходимо было найти одинаковые фотографии на разных объектах недвижимости. Т.е. к объектам недвижимости расположенных с разным местоположением крепилась одна и та же фотография, может ошибочно, может специально, но такие объекты надо было найти. И я хотел бы поделиться тем, как я решал эту…
Работа с календарными данными является неотъемлемой частью многих приложений и проектов, связанных с планированием событий, управлением ресурсами и анализом данных. Базовой библиотекой для работы с датами и временем является datetime, но иногда её функционала оказывается недостаточно для решения каких-то задач, и приходится обращаться к сторонним…
В современном мире трудно найти человека, который бы не слышал про нейронные сети. Кажется, их применяют всюду: оживление фотографий, DeepFake, маски для фото в соцсетях и прочее. Но для большинства людей они являются чем-то абстрактным и непонятным.
Важным для качественного решения задач CV (Computer Vision) с помощью нейронных сетей, помимо наличия качественной модели (зачастую уже предобученной на других задачах), также является датасет с достаточным количеством изображений (несколько десятков тысяч).
Pandas уже давно является неотъемлемым инструментом в арсенале любого специалиста, работающего с данными на языке Python. Ровно также неотъемлемым навыком является знание языка SQL, предназначенного для извлечения, хранения и модификации данных из реляционных баз.
Можно бесконечно долго «воротить нос» от использования SQL для Data Preparation, отдавая лавры змеиному языку, но нельзя не признавать факт, что чаще мы используем и еще долго будем использовать SQL для работы с данными, в том числе и очень объемными.