🧹 Defuddle — чистый Markdown из любой веб-страницы
AI-агентам и скриптам нужен чистый текст, а не HTML хаос с рекламой, трекерами и навигационными блоками. Defuddle снимает весь этот слой и возвращает только контент в Markdown и с метаданными в YAML
Изначально проект сделан для Obsidian Web Clipper, но вырос в полноценный инструмент для разработчиков и AI-пайплайнов. Помимо чистого текста иснтурмент позволяет вытаскивает структурированные метаданные: автор, дата публикации, язык, описание
Особенности
— Фильтрация рекламы, навигации, сайдбаров, трекинг пикселей и скрытых элементов
— Метаданные страницы в YAML-формате: автор, дата, язык, описание (все готовы для базы знаний)
— Четыре режима: веб-интерфейс, CLI, Node.js-библиотека, self-hosted
— Одна команда в CLI: curl defuddle.md/URL — для скриптов и автоматизаций
— Интеграция с Obsidian Web Clipper из коробки
Тарифы
Бесплатно: полный функционал, open-source на GitHub
Как попробовать
1. Перейти на defuddle.md
2. Добавить нужный URL в поле ввода
3. Получить чистый Markdown с метаданными без лишних шагов
Итого: оптимально для AI-агентов, n8n-сценариев и любых задач, где важен чистый текст без HTML-шума
ТГ-канал, где сложные темы становятся простыми, а промты экономят уйму времени⬇