簡體   English   中英

以PDF格式獲取文本字段的尺寸和坐標

[英]Get dimensions and coordinates of textfields in PDF

是否可以使用PHP或Linux庫獲取PDF文檔中所有文本字段的X / Y坐標和高度/寬度? 我正在使用PDFTK提取PDF中的所有文本字段,但它不提供坐標和/或尺寸信息。 如果沒有,是否可以遍歷PDF文檔並計算文本字段的x,y和高度/寬度數據?

這是可能的,但幾乎不可行。

您可以使用FPDI在PHP中打開PDF文檔。 它在內存中生成PDF對象的抽象樹。 TCPDF和FPDF可以將其保存回來。

然而遍歷所述樹並找到正確的屬性非常。 (我意外地是動詞。)

現在PDF格式實際上是人類可讀的。 它肯定會包含可讀格式的坐標(主要是在IIRC點)。 如果你只知道在哪里看,你可能會用一個簡單的正則表達式來發現它。 某些節點只需要進行gzuncompress()編輯,您無需修改​​文檔或將其保存回來。 因此,嘗試使用FPDI和print_r()來設計策略。

是的,這不是太難。 我所知道的最好的工具是pdfminer 它是python,但是如果你不想使用python,你可以只用xml格式轉儲pdf信息,用你選擇的武器解析它:)如果你有麻煩:)回復:)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM