繁体 English 中英

使用 Python/OpenCV/Tesseract 从图像中提取数据？

[英]Extract Data from an Image with Python/OpenCV/Tesseract?

原文 2020-04-10 01:09:19 0 1 python/ opencv/ tesseract/ python-tesseract/ opencv-python

我正在尝试从裁剪的图像中提取一些内容。 我试过pytesseract和opencv模板匹配但是结果很差。 OpenCV 模板匹配有时会由于图标质量差而失败，而 tesseract 给了我一行带有错误字符的文本。

我正在尝试获取这样的值：

0:26 83 1 1

有什么想法或技巧吗？

1 个解决方案

您可以使用的一种技术是模糊您的图像。 从它的外观来看，图像已经有点低分辨率和模糊，所以你不需要非常努力地模糊图像。 每当我需要在 Opencv 中使用模糊 function 时，我通常会选择高斯模糊，因为它模糊每个像素以及每个周围像素的技术都很棒。 一旦图像模糊，我将对图像进行阈值或自适应阈值。 一旦你走到这一步，应该显示的图像应该主要是硬线，中间夹杂着少量的短线。 然后，将阈值图像扩大到足以连接有很多硬边缘的位。 执行扩张后，找到该图像的轮廓，并根据它们与图像的高度进行排序。 由于我假设这些数字的 position 不会改变，因此您只需根据图像的高度对轮廓进行排序。 之后，一旦你对轮廓进行了排序，只需在它们上面创建边界框，然后从那里读取文本。

但是，如果您想以快速而肮脏的方式执行此操作，则始终可以在要阅读的每个区域周围手动创建自己的 ROI 并以这种方式进行。

第一种方法

高斯模糊图像
阈值图像
放大图像
查找轮廓
根据高度对等高线进行排序
在相关轮廓周围创建边界框

第二种方法

在要从中读取文本的区域周围手动创建 ROI

在 python 中使用 openCV 和 Tesseract 从图像中提取主标题

[英]extract the main heading from the image using openCV and Tesseract in python

使用 OpenCV Python 和 Tesseract 从图像中读取车牌

[英]Reading license plate from image using OpenCV Python and Tesseract

无法使用 python、Tesseract 和 opencv 从图像中获取数字

[英]Can't get numbers from image with python, Tesseract and opencv

使用Python tesseract从具有2D数组的图像中提取数字

[英]Extract number from image with 2D array using Python tesseract

无法使用 python tesseract 和 OpenCV 读取图像文本

[英]Unable to read image text with python tesseract and OpenCV

如何在Python中将OpenCV图像传递给Tesseract？

[英]How to pass OpenCV image to Tesseract in python?

Python从图像opencv中提取多个对象

[英]Python extract multiple objects from image opencv

通过 python opencv 从图像中提取模式

[英]extract pattern from image via python opencv

从tesseract hocr xhtml文件中提取数据

[英]Extract data from tesseract hocr xhtml file

OCR：检查字母是否在图像的（字符串）中（Opencv，Python，Tesseract）

[英]OCR: check if letter is in (string) of image (Opencv, Python, Tesseract)

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在 python 中使用 openCV 和 Tesseract 从图像中提取主标题使用 OpenCV Python 和 Tesseract 从图像中读取车牌无法使用 python、Tesseract 和 opencv 从图像中获取数字使用Python tesseract从具有2D数组的图像中提取数字无法使用 python tesseract 和 OpenCV 读取图像文本如何在Python中将OpenCV图像传递给Tesseract？ Python从图像opencv中提取多个对象通过 python opencv 从图像中提取模式从tesseract hocr xhtml文件中提取数据 OCR：检查字母是否在图像的（字符串）中（Opencv，Python，Tesseract）

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM