簡體   English   中英

如何從 Java 格式的文件(word 文檔、excel)中讀取數據?

[英]How to read data from a file (word document, excel) with format in Java?

我有一個文件formatting.doc。 里面有一些文字。 現在我為文檔中的文本添加了一些格式。 我在第一段開始前加了空格,給一些詞加了下划線,把一些詞加粗,並在段落中央對齊。

在我的應用程序中,我嘗試使用 Apache POI 讀取文件,然后使用 iText 以 PDF 格式顯示。 但是,Apache POI 返回的文本是原始數據。 即沒有任何格式。

Java 中有什么方法可以讀取帶有所有格式的文件的文本嗎?

我相信您最好的選擇是使用Apache Tika 它使用 Apache POI 和其他一些庫,並提供格式化提取等功能。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM