繁体   English   中英

如何从 Java 格式的文件(word 文档、excel)中读取数据?

[英]How to read data from a file (word document, excel) with format in Java?

我有一个文件formatting.doc。 里面有一些文字。 现在我为文档中的文本添加了一些格式。 我在第一段开始前加了空格,给一些词加了下划线,把一些词加粗,并在段落中央对齐。

在我的应用程序中,我尝试使用 Apache POI 读取文件,然后使用 iText 以 PDF 格式显示。 但是,Apache POI 返回的文本是原始数据。 即没有任何格式。

Java 中有什么方法可以读取带有所有格式的文件的文本吗?

我相信您最好的选择是使用Apache Tika 它使用 Apache POI 和其他一些库,并提供格式化提取等功能。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM