在使用 Tesseract 进行文本识别之前预处理图像

Question

我有一个扫描的页面，我正在尝试识别和解析图像中的数字（逐行）。 为此，我使用 Python Pytessarect，代码如下：

img = cv2.imread('image.jpg',0)
ret,thresh1 = cv2.threshold(img,110,255,cv2.THRESH_TOZERO)
scan_config = r'--oem 3 --psm 6'
extracted_text = pytesseract.image_to_string(thresh1, config=scan_config)

输入图像.jpg:

不幸的是，结果并不令人满意，因为如您所见，第 4 列的数字被部分擦除（人眼可以识别这些数字，但阈值算法使情况变得更糟）：

006442000180
006354924010
005900000461
062891556156
006*3*00000261
006900000261

有人知道如何预处理图像，以便算法能够识别甚至是被擦除的数字吗？ 顺便说一下，阈值 function 的第二个参数是硬编码的 (110)，它可能不会匹配所有图像，这取决于照片的质量，有没有办法动态生成值或使用替代方法阈值方法（可能使用 OpenCV 过滤器）？

Answer 1

tesseract PzCox.png - --dpi 72 --psm 6

用（英语） model 制作这个最好：

006442000180
006354924010
005300000461
062891556156
006300000261
006300000261

在使用 Tesseract 进行文本识别之前预处理图像

问题描述

1 个解决方案

解决方案1
0 2020-08-04 17:24:56

在使用 Tesseract 进行文本识别之前预处理图像

问题描述

1 个解决方案

解决方案1 0 2020-08-04 17:24:56

解决方案1
0 2020-08-04 17:24:56