繁体   English   中英

开源Java文本解析器

[英]Open Source Java Text Parsers

有没有可以用来解析办事处(窗口)的文件,OpenOffice的文件和PDF以及一个 Java文本解析器? 还需要为Word文档使用诸如Apache POI之类的东西,为OpenOffice和PDF使用其他库吗? 如果是这样,那么OpenOffice和PDF的最佳选择是什么?

如果任务是阅读PDF文档,那么iText是最好的选择。 对于基于Microsoft Office和OpenOffice(LibreOffice)的文档,POI将是我的解决方案。

Apache Tika

Apache Tika™工具箱使用现有的解析器库从各种文档中检测并提取元数据和结构化文本内容。

不知道这是否符合您的目的。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM