簡體   English   中英

開源Java文本解析器

[英]Open Source Java Text Parsers

有沒有可以用來解析辦事處(窗口)的文件,OpenOffice的文件和PDF以及一個 Java文本解析器? 還需要為Word文檔使用諸如Apache POI之類的東西,為OpenOffice和PDF使用其他庫嗎? 如果是這樣,那么OpenOffice和PDF的最佳選擇是什么?

如果任務是閱讀PDF文檔,那么iText是最好的選擇。 對於基於Microsoft Office和OpenOffice(LibreOffice)的文檔,POI將是我的解決方案。

Apache Tika

Apache Tika™工具箱使用現有的解析器庫從各種文檔中檢測並提取元數據和結構化文本內容。

不知道這是否符合您的目的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM