С# парсинг файлов Word и Excel
С# парсинг файлов Word и Excel

В процессе анализа информации часто возникает потребность в обработке данных из документов в форматах MS Word или Excel. Как считывать информации из таких файлов с использованием языка C #.

33

Способ, описаннный в статье, очень медленный и требует установленных Word, Excel и т. д. Это очень частный случай для десктопного приложения. В случае вебсервера или мобильного приложения им пользоваться невозможно. (Сейчас увидел упоминание об этом в статье). Все современные x-форматы Office — это xml документы, описанные в спецификации OpenXML. Есть нативная библиотека от Microsoft для работы с документами в этом формате. Это сложный стандарт, описание занимает больше тысячи страниц. Люди написали обёртки над той библиотекой, с ними работать проще.
Про старые doc и xls советую забыть. 

2
Ответить