簡體   English   中英

以xml格式保存Word文檔

[英]Saving a word document in xml format

我試圖將一個Word文件保存為xml格式,並在解析后對該XML文件執行一些操作。

我在Word文檔中擁有的數據被分成不同的標簽。

如果我的Word文檔中有$ date,它將$和date分成兩個標簽.tlyadd也分為tly和add兩個標簽,而tlyabcd保留在一個標簽中。

在另一個文檔中,這些值沒有分成不同的標簽。

我不明白這些值是在什么基礎上放入不同的標記中。

我在msdn上的xml字詞格式中找不到任何內容。

有人可以解釋為什么以及在什么基礎上進行解釋。

這是包含這些值的文檔

讓我知道是否不清楚,需要更多說明

您不應對文本是一次運行還是多次運行做出任何假設。 沒有規則限制可以拆分文本的情況。

就是說,有很多事情會迫使您的文本在運行中分開:

  • 拼寫/語法檢查(可能與$ date一起發生),您可以將其關閉
  • 格式化,例如,如果單詞的一半是粗體
  • 修訂(不同人在不同時間更改文檔-rsid)
  • 變更追蹤等

您可以/應該預處理文檔以加入運行。 參見例如docx4j的VariablePrepare.java

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM