繁体 English 中英

使用 pytesseract python 从扫描的 PDF 中提取表格到 csv

[英]Extract table into csv from scanned PDF by using pytesseract python

原文 2020-01-14 09:36:54 0 1 python/ python-3.x/ python-tesseract

我有不同类型的发票文件，我想在每个发票文件中找到表格。 我可以使用“pdf2jpg”方法将扫描的 pdf 转换为图像，现在我必须从每张发票中提取表格并使用 OCR pytesseract 方法写入 csv 文件。 请帮忙。

1 个解决方案

也许这段代码会帮助你：

import pyautogui
import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

text = pytesseract.image_to_string('c:\\screenshot\\test.png')

f = open('c:\\screenshot\\csvfile_1.csv','w')
f.write(text)
f.close()

如何使用pytesseract在Python中读取扫描表？

[英]How to read scanned table in Python using pytesseract?

在 Python 中使用 pytesseract 从图像中提取时间

[英]extract time from images using pytesseract in Python

使用python从PDF提取扫描页面

[英]Extracting scanned pages from PDF using python

如何使用Python从手写的扫描PDF中提取数据？

[英]How can I extract data from a handwritten, scanned PDF using Python?

如何使用pytesseract从pdf文件中的图像中提取文本

[英]how to extract text from images in a pdf file using pytesseract

从扫描文档 opencv python 中提取内衬表

[英]Extract lined table from scanned document opencv python

无法在python中使用pytesseract从tif图像中提取文本

[英]unable to extract text from tif image using pytesseract in python

从扫描的 pdf 中提取带有图像的文本？

[英]Extract text from a scanned pdf with images?

如何使用python从扫描的文档中提取文本

[英]how to extract text from scanned documents using python

如何使用 opencv 和 pytesseract python 提取文本？

[英]how to extract text using opencv and pytesseract python?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何使用pytesseract在Python中读取扫描表？在 Python 中使用 pytesseract 从图像中提取时间使用python从PDF提取扫描页面如何使用Python从手写的扫描PDF中提取数据？如何使用pytesseract从pdf文件中的图像中提取文本从扫描文档 opencv python 中提取内衬表无法在python中使用pytesseract从tif图像中提取文本从扫描的 pdf 中提取带有图像的文本？如何使用python从扫描的文档中提取文本如何使用 opencv 和 pytesseract python 提取文本？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM