簡體 English 中英

使用 pytesseract python 從掃描的 PDF 中提取表格到 csv

[英]Extract table into csv from scanned PDF by using pytesseract python

原文 2020-01-14 09:36:54 1 1 python/ python-3.x/ python-tesseract

我有不同類型的發票文件，我想在每個發票文件中找到表格。 我可以使用“pdf2jpg”方法將掃描的 pdf 轉換為圖像，現在我必須從每張發票中提取表格並使用 OCR pytesseract 方法寫入 csv 文件。 請幫忙。

1 個解決方案

也許這段代碼會幫助你：

import pyautogui
import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

text = pytesseract.image_to_string('c:\\screenshot\\test.png')

f = open('c:\\screenshot\\csvfile_1.csv','w')
f.write(text)
f.close()

如何使用pytesseract在Python中讀取掃描表？

[英]How to read scanned table in Python using pytesseract?

在 Python 中使用 pytesseract 從圖像中提取時間

[英]extract time from images using pytesseract in Python

使用python從PDF提取掃描頁面

[英]Extracting scanned pages from PDF using python

如何使用Python從手寫的掃描PDF中提取數據？

[英]How can I extract data from a handwritten, scanned PDF using Python?

如何使用pytesseract從pdf文件中的圖像中提取文本

[英]how to extract text from images in a pdf file using pytesseract

從掃描文檔 opencv python 中提取內襯表

[英]Extract lined table from scanned document opencv python

無法在python中使用pytesseract從tif圖像中提取文本

[英]unable to extract text from tif image using pytesseract in python

從掃描的 pdf 中提取帶有圖像的文本？

[英]Extract text from a scanned pdf with images?

如何使用python從掃描的文檔中提取文本

[英]how to extract text from scanned documents using python

如何使用 opencv 和 pytesseract python 提取文本？

[英]how to extract text using opencv and pytesseract python?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何使用pytesseract在Python中讀取掃描表？在 Python 中使用 pytesseract 從圖像中提取時間使用python從PDF提取掃描頁面如何使用Python從手寫的掃描PDF中提取數據？如何使用pytesseract從pdf文件中的圖像中提取文本從掃描文檔 opencv python 中提取內襯表無法在python中使用pytesseract從tif圖像中提取文本從掃描的 pdf 中提取帶有圖像的文本？如何使用python從掃描的文檔中提取文本如何使用 opencv 和 pytesseract python 提取文本？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM