Microsoft открыла код для Data Formulator

Это инструмент, который превращает сырые датасеты в готовые визуализации, используя LLM и простой интерфейс.

Вы загружаете данные через drag-and-drop или пишете запрос на естественном языке, а система сама разбирается, что к чему.

Что умеет эта штука:

Модели: Интеграция с OpenAI, Anthropic, Azure и Ollama. То есть можно подключить как платные API, так и запустить локальную модель.

Базы данных: Поддерживает MySQL, PostgreSQL, MSSQL, Azure, S3 и DuckDB. Вы подключаетесь к источнику, и инструмент сам генерирует SQL-джойны для множественных таблиц.

Процесс: Система умеет закреплять промежуточные датасеты, позволяя строить анализ шаг за шагом. Это полезно для сложных сценариев, где нужно сохранять состояние данных.

Запуск: Локально через Python или в облаке через GitHub Codespaces.

Проект распространяется под лицензией MIT, что дает полную свободу использования и модификации. Microsoft явно хочет демократизировать аналитику, убирая необходимость в постоянной помощи дата-инженеров для рутинных запросов.

Подписывайтесь на Telegram Точки над ИИ.

1
Начать дискуссию