繁体   English   中英

有没有办法使用 python 测量 pdf 的边距?

[英]is there a way to measure margins of a pdf using python?

我一直在使用不同的 python 包来解析 PDF,但我想知道是否可以测量文档中特定行的边距。 如果可能的话,我想要的测量值是像素 css 样式。

它不需要那么具体,只是根据边距从左到右判断一条线是左对齐、居中还是右对齐。

例子:

# margin <= x
left-aligned

# margin >= y && margin <= z
                            center-aligened

# margin >= z
                                                              right-aligned

显然这只是一个例子,但边距差异不会很大,这意味着,我正在解析的 PDF 可能会有(以 css 的形式):

  • margin-left: 0
  • margin-left: x
  • margin-left: y

x, y的实际值并不重要,重要的是它们是一致的。

抱歉,如果这令人困惑,我主要要求的是澄清或帮助计算 pdf 中每一行的左边距。

免责声明:我是borb的作者,这个答案中使用的库

您可以在borb中使用SimpleLineOfTextExtraction ,它返回 PDF 中的文本行。

您可以在此处查看此 class。

每行都有一个内容框(和一个布局框),它可以为您提供有关该特定文本行位置的信息。

您可以使用它来确定一条线是否左/右/中对齐,方法是将它与其上方/下方的线进行比较。

您可以在此处找到有关如何使用此 class 的示例。

本质上,您使用PDF.loads方法打开一个文档,并传递一个EventListener

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM