![](/img/trans.png)
[英]Converting the current MS Word document to xml and saving it in a target file
[英]Saving a word document in xml format
我试图将一个Word文件保存为xml格式,并在解析后对该XML文件执行一些操作。
我在Word文档中拥有的数据被分成不同的标签。
例
如果我的Word文档中有$ date,它将$和date分成两个标签.tlyadd也分为tly和add两个标签,而tlyabcd保留在一个标签中。
在另一个文档中,这些值没有分成不同的标签。
我不明白这些值是在什么基础上放入不同的标记中。
我在msdn上的xml字词格式中找不到任何内容。
有人可以解释为什么以及在什么基础上进行解释。
这是包含这些值的文档
让我知道是否不清楚,需要更多说明
您不应对文本是一次运行还是多次运行做出任何假设。 没有规则限制可以拆分文本的情况。
就是说,有很多事情会迫使您的文本在运行中分开:
您可以/应该预处理文档以加入运行。 参见例如docx4j的VariablePrepare.java
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.