繁体   English   中英

以xml格式保存Word文档

[英]Saving a word document in xml format

我试图将一个Word文件保存为xml格式,并在解析后对该XML文件执行一些操作。

我在Word文档中拥有的数据被分成不同的标签。

如果我的Word文档中有$ date,它将$和date分成两个标签.tlyadd也分为tly和add两个标签,而tlyabcd保留在一个标签中。

在另一个文档中,这些值没有分成不同的标签。

我不明白这些值是在什么基础上放入不同的标记中。

我在msdn上的xml字词格式中找不到任何内容。

有人可以解释为什么以及在什么基础上进行解释。

这是包含这些值的文档

让我知道是否不清楚,需要更多说明

您不应对文本是一次运行还是多次运行做出任何假设。 没有规则限制可以拆分文本的情况。

就是说,有很多事情会迫使您的文本在运行中分开:

  • 拼写/语法检查(可能与$ date一起发生),您可以将其关闭
  • 格式化,例如,如果单词的一半是粗体
  • 修订(不同人在不同时间更改文档-rsid)
  • 变更追踪等

您可以/应该预处理文档以加入运行。 参见例如docx4j的VariablePrepare.java

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM