簡體   English   中英

有沒有辦法使用 python 測量 pdf 的邊距?

[英]is there a way to measure margins of a pdf using python?

我一直在使用不同的 python 包來解析 PDF,但我想知道是否可以測量文檔中特定行的邊距。 如果可能的話,我想要的測量值是像素 css 樣式。

它不需要那么具體,只是根據邊距從左到右判斷一條線是左對齊、居中還是右對齊。

例子:

# margin <= x
left-aligned

# margin >= y && margin <= z
                            center-aligened

# margin >= z
                                                              right-aligned

顯然這只是一個例子,但邊距差異不會很大,這意味着,我正在解析的 PDF 可能會有(以 css 的形式):

  • margin-left: 0
  • margin-left: x
  • margin-left: y

x, y的實際值並不重要,重要的是它們是一致的。

抱歉,如果這令人困惑,我主要要求的是澄清或幫助計算 pdf 中每一行的左邊距。

免責聲明:我是borb的作者,這個答案中使用的庫

您可以在borb中使用SimpleLineOfTextExtraction ,它返回 PDF 中的文本行。

您可以在此處查看此 class。

每行都有一個內容框(和一個布局框),它可以為您提供有關該特定文本行位置的信息。

您可以使用它來確定一條線是否左/右/中對齊,方法是將它與其上方/下方的線進行比較。

您可以在此處找到有關如何使用此 class 的示例。

本質上,您使用PDF.loads方法打開一個文檔,並傳遞一個EventListener

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM