cost 243 ms
有沒有辦法使用 python 測量 pdf 的邊距?

[英]is there a way to measure margins of a pdf using python?

我一直在使用不同的 python 包來解析 PDF,但我想知道是否可以測量文檔中特定行的邊距。 如果可能的話,我想要的測量值是像素 css 樣式。 它不需要那么具體,只是根據邊距從左到右判斷一條線是左對齊、居中還是右對齊。 例子: 顯然這只是一個例子,但邊距差異不會很大,這意味着,我正在解析的 P ...

使用search_for時如何使用Python Fitz檢測連字符?

[英]How to use Python Fitz detect Hyphen when using search_for?

我是 Fitz 庫的新手,正在做一個項目,我需要在 PDF 頁面中找到一個字符串。 我遇到了一種情況,我正在搜索的頁面上的文本被連字符連接。 我知道我可以在搜索 function 時使用 TEXT_DEHYPHENATE 標志,但這對我不起作用(如圖所示https://postimg.cc/zHZ ...

有沒有辦法在保持其結構(項目符號列表的級別和深度)的同時讀取 pdf 或 python 中的 word 文檔的內容

[英]is there a way to read the contents of a pdf or word document in python while keeping its structure (level and depth of bulleted lists)

我想從 pdf 或 word 文檔中生成 html 代碼。 該文檔包含項目符號列表和一些項目符號列表包含和其他項目符號列表。 我想轉換 html 中的項目符號列表,但是當我提取文檔的內容時,我只有一個沒有初始結構和項目符號的粗略文本。 我需要一種方法來識別文檔中的項目符號及其深度謝謝你的幫助 ...

在 Adob​​e pdf services API 上將 .pdf 轉換為 .docx(使用 Python)

[英]Convert .pdf to .docx on Adobe pdf services API (using Python)

我正在嘗試編寫一個 Python 程序,將“.pdf”文件轉換為“.docx”文件,使用 Adob​​e PDF Server API(免費試用)。 我發現文獻能夠將任何“.pdf”文件轉換為包含“.txt”文件(恢復文本數據)和“.excel”文件(返回表格數據)的“.zip”文件。 但是我 ...

文檔屬性 (PDF) 中的“已創建”和“已修改”字段未顯示

[英]Fields “Created” and “Modified” in Document Properties (PDF) were not displayed

目前我已將許多 PDF 合並在一起以創建一個 PDF。 我添加了元數據信息,其中包括“創建”和“修改”兩個字段,但結果這些字段仍然不顯示信息。 這是我的源代碼: 圖片 你能給我一些建議嗎? ...

從 pdf 中提取文本 從 S3 存儲桶中提取文件 python

[英]extract text from pdf File from S3 bucket python

我的 AWS s3 存儲桶中有多個格式文件,例如 pdf,doc,rtf,odt,png,我需要從中提取文本。 我已經設法獲得了內容列表及其路徑。現在根據文件類型,我將使用不同的庫從文件中提取文本。 由於文件可能有數千個,我需要直接從 s3 中提取文本而不是下載。 我嘗試了一些但它給了我錯誤 但我 ...

pdfplumber 給出 fp.seek(pos) AttributeError: 'dict' object has no attribute 'seek'

[英]pdfplumber gives fp.seek(pos) AttributeError: 'dict' object has no attribute 'seek'

所以這是我的代碼: 主要的() 其中 combinedparser.py 有兩個函數: 我有一個包含 pdf 和隨機散布的文本文件的目錄。 我正在嘗試使用裝飾器 @file_discriminator 運行 function advparser,它使用 pdfplumber 和后續處理從目錄中的 ...

Django 在某些頁碼上打開 pdf

[英]Django open pdf on certain page number

我正在嘗試創建一個 PDF 分析 web 應用程序,但我被卡住了。 我想允許用戶打開 pdf 的某個頁面,其中有超過 300 個頁面。 那么,誰能告訴我如何使用 Django 在特定頁面的新選項卡中打開 pdf ? 編輯——實際上 Django 代碼正在 AWS 服務器上運行,我希望用戶在分析后存 ...

如何從 python 中的銀行對帳單 PDF 中讀取數據?

[英]How to read data from bank statement PDF in python?

我必須從包含文本和表格的銀行對帳單 PDF 中讀取數據。 我嘗試了一些通過堆棧溢出提供的解決方案,但大多數都出現錯誤。 從以下許多代碼中,我得到了一個代碼,但沒有得到預期的結果。 得到 output 作為 - 但是想要 PDF 文件中的數據,而不是 PDF 文件中的數據。 有人可以為我提供從銀行對 ...

Python 不使用 pyPDF2 打印 PDF

[英]Python does not print PDF with pyPDF2

我嘗試打印 pdf 文檔的頁面: 但我只得到很多空白,沒有錯誤消息。 難道PyPDF2不支持這個pdf版本(my.pdf)? 這解決了它(打印文檔的所有頁面)。 謝謝 ...

如何使用python從pdf中提取一些數學表達式?

[英]How to extract some mathematical expressionfrom pdf using python?

我有一個具有數學等式像PDF這樣 我試圖從 pdf 文件中提取客觀問題,並使用 python 將它們轉換為 csv 文件,這樣表格的每一行都包含一個問題,每列中有四個選項和一個正確的選項(總共六列)。 但是那個 pdf 也有那些數學方程,我不能把它們寫成 csv 文件。 是否可以像在 pdf 文件中 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM