В этой статье мы рассмотрим создание инструмента, с помощью которого можно получать читабельный текст из статей с минимальной «лишней» информацией.
Использую xpath для парсинга на python и php, все лучше чем BeautifulSoup)
вы наверное имели ввиду lxml или какую-то еще библиотеку для работы с xml/html? xpath это ж язык запросов к элементам XML.