Microsoft открыла код для Data Formulator
Это инструмент, который превращает сырые датасеты в готовые визуализации, используя LLM и простой интерфейс.
Вы загружаете данные через drag-and-drop или пишете запрос на естественном языке, а система сама разбирается, что к чему.
Что умеет эта штука:
• Модели: Интеграция с OpenAI, Anthropic, Azure и Ollama. То есть можно подключить как платные API, так и запустить локальную модель.
• Базы данных: Поддерживает MySQL, PostgreSQL, MSSQL, Azure, S3 и DuckDB. Вы подключаетесь к источнику, и инструмент сам генерирует SQL-джойны для множественных таблиц.
• Процесс: Система умеет закреплять промежуточные датасеты, позволяя строить анализ шаг за шагом. Это полезно для сложных сценариев, где нужно сохранять состояние данных.
• Запуск: Локально через Python или в облаке через GitHub Codespaces.
Проект распространяется под лицензией MIT, что дает полную свободу использования и модификации. Microsoft явно хочет демократизировать аналитику, убирая необходимость в постоянной помощи дата-инженеров для рутинных запросов.
Подписывайтесь на Telegram Точки над ИИ.