![](/img/trans.png)
[英]is there a way to measure margins of a pdf using python?
我一直在使用不同的 python 包來解析 PDF,但我想知道是否可以測量文檔中特定行的邊距。 如果可能的話,我想要的測量值是像素 css 樣式。 它不需要那么具體,只是根據邊距從左到右判斷一條線是左對齊、居中還是右對齊。 例子: 顯然這只是一個例子,但邊距差異不會很大,這意味着,我正在解析的 P ...
[英]is there a way to measure margins of a pdf using python?
我一直在使用不同的 python 包來解析 PDF,但我想知道是否可以測量文檔中特定行的邊距。 如果可能的話,我想要的測量值是像素 css 樣式。 它不需要那么具體,只是根據邊距從左到右判斷一條線是左對齊、居中還是右對齊。 例子: 顯然這只是一個例子,但邊距差異不會很大,這意味着,我正在解析的 P ...
[英]How to use Python Fitz detect Hyphen when using search_for?
我是 Fitz 庫的新手,正在做一個項目,我需要在 PDF 頁面中找到一個字符串。 我遇到了一種情況,我正在搜索的頁面上的文本被連字符連接。 我知道我可以在搜索 function 時使用 TEXT_DEHYPHENATE 標志,但這對我不起作用(如圖所示https://postimg.cc/zHZ ...
[英]is there a way to read the contents of a pdf or word document in python while keeping its structure (level and depth of bulleted lists)
我想從 pdf 或 word 文檔中生成 html 代碼。 該文檔包含項目符號列表和一些項目符號列表包含和其他項目符號列表。 我想轉換 html 中的項目符號列表,但是當我提取文檔的內容時,我只有一個沒有初始結構和項目符號的粗略文本。 我需要一種方法來識別文檔中的項目符號及其深度謝謝你的幫助 ...
[英]Convert .pdf to .docx on Adobe pdf services API (using Python)
我正在嘗試編寫一個 Python 程序,將“.pdf”文件轉換為“.docx”文件,使用 Adobe PDF Server API(免費試用)。 我發現文獻能夠將任何“.pdf”文件轉換為包含“.txt”文件(恢復文本數據)和“.excel”文件(返回表格數據)的“.zip”文件。 但是我 ...
[英]Fields “Created” and “Modified” in Document Properties (PDF) were not displayed
目前我已將許多 PDF 合並在一起以創建一個 PDF。 我添加了元數據信息,其中包括“創建”和“修改”兩個字段,但結果這些字段仍然不顯示信息。 這是我的源代碼: 圖片 你能給我一些建議嗎? ...
[英]extract text from pdf File from S3 bucket python
我的 AWS s3 存儲桶中有多個格式文件,例如 pdf,doc,rtf,odt,png,我需要從中提取文本。 我已經設法獲得了內容列表及其路徑。現在根據文件類型,我將使用不同的庫從文件中提取文本。 由於文件可能有數千個,我需要直接從 s3 中提取文本而不是下載。 我嘗試了一些但它給了我錯誤 但我 ...
[英]can't use PyPDF2 to open my pdf file on jupyter notebook
我嘗試打開一個我下載的 pdf 文件,該文件已經安裝了 PyPDF2 模塊,如下所示: 它給了我一個 filenotfound 錯誤消息: ...
[英]pdfplumber gives fp.seek(pos) AttributeError: 'dict' object has no attribute 'seek'
所以這是我的代碼: 主要的() 其中 combinedparser.py 有兩個函數: 我有一個包含 pdf 和隨機散布的文本文件的目錄。 我正在嘗試使用裝飾器 @file_discriminator 運行 function advparser,它使用 pdfplumber 和后續處理從目錄中的 ...
[英]Django open pdf on certain page number
我正在嘗試創建一個 PDF 分析 web 應用程序,但我被卡住了。 我想允許用戶打開 pdf 的某個頁面,其中有超過 300 個頁面。 那么,誰能告訴我如何使用 Django 在特定頁面的新選項卡中打開 pdf ? 編輯——實際上 Django 代碼正在 AWS 服務器上運行,我希望用戶在分析后存 ...
[英]How to read data from bank statement PDF in python?
我必須從包含文本和表格的銀行對帳單 PDF 中讀取數據。 我嘗試了一些通過堆棧溢出提供的解決方案,但大多數都出現錯誤。 從以下許多代碼中,我得到了一個代碼,但沒有得到預期的結果。 得到 output 作為 - 但是想要 PDF 文件中的數據,而不是 PDF 文件中的數據。 有人可以為我提供從銀行對 ...
[英]How to store PDF in MySQL database without generating PDF file in Python
So basically I have a base64 encoded PDF data in MySQL database, And I want to manipulate that data ( Update the form fields of PDF file data), after ...
[英]Python does not print PDF with pyPDF2
我嘗試打印 pdf 文檔的頁面: 但我只得到很多空白,沒有錯誤消息。 難道PyPDF2不支持這個pdf版本(my.pdf)? 這解決了它(打印文檔的所有頁面)。 謝謝 ...
[英]Need help in importing data from pdfplumber to .csv file
我使用 pdfplumber 從 pdf 中提取文本,但是當我嘗試使用 to_csv 導入數據時,拋出 #me 錯誤。 在將數據導入 .csv 時需要幫助 沒有得到導入文件中的數據只是得到了一個空文件 ...
[英]How to extract some mathematical expressionfrom pdf using python?
我有一個具有數學等式像PDF這樣 我試圖從 pdf 文件中提取客觀問題,並使用 python 將它們轉換為 csv 文件,這樣表格的每一行都包含一個問題,每列中有四個選項和一個正確的選項(總共六列)。 但是那個 pdf 也有那些數學方程,我不能把它們寫成 csv 文件。 是否可以像在 pdf 文件中 ...
[英]PDF document: How to verify the digital signature using python?
我們正在做 RPA 項目並使用 python 將數據 PDF 提取到 excel 中。 現在我們需要驗證 PDF 中的數字簽名。 ...