![](/img/trans.png)
[英]Converting the current MS Word document to xml and saving it in a target file
[英]Saving a word document in xml format
我試圖將一個Word文件保存為xml格式,並在解析后對該XML文件執行一些操作。
我在Word文檔中擁有的數據被分成不同的標簽。
例
如果我的Word文檔中有$ date,它將$和date分成兩個標簽.tlyadd也分為tly和add兩個標簽,而tlyabcd保留在一個標簽中。
在另一個文檔中,這些值沒有分成不同的標簽。
我不明白這些值是在什么基礎上放入不同的標記中。
我在msdn上的xml字詞格式中找不到任何內容。
有人可以解釋為什么以及在什么基礎上進行解釋。
這是包含這些值的文檔
讓我知道是否不清楚,需要更多說明
您不應對文本是一次運行還是多次運行做出任何假設。 沒有規則限制可以拆分文本的情況。
就是說,有很多事情會迫使您的文本在運行中分開:
您可以/應該預處理文檔以加入運行。 參見例如docx4j的VariablePrepare.java
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.