繁体   English   中英

使用python-docx识别word文档.docx文件中的封面

[英]Identifying a cover page in word document .docx file using python-docx

我很想知道是否有可能在 .docx 文件的 xml 中识别可用于区分 Word 文档封面的任何元素。

到目前为止,我发现的唯一可识别的表示封面的元素是分页符。

<w:br type="page"> 

但是,这与整个文档中可以找到的分页符相同。

这个问题的目的是,如果word文件中存在封面,我希望从第二页开始编号,否则从第1页开始。

  • 也许有一个段落样式只出现在封面上(也许是“标题”)
  • 也许封面是它自己的部分,并且有一个独特的页眉或页脚
  • 也许有一个独特的页眉或页脚显示为“仅首页”(三种页眉/页脚类型之一)。
  • 也许文本中有一个常见的字符串或字符串模式。

这些是一些想法,但简而言之,您需要根据内容来检测这样的事情。 Word 中没有与其他页面不同的“封面”概念。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM