Tesseract 无法读取图像中的数字（验证码）

Question

我有这个图像：未处理的图像从下面的代码中，我能够将其转换为：已处理的图像

图像的编号为： 8276但我的代码将其读取为776

如何成功地使我的代码能够将其读取为8276 ？ 我对这个图像处理/cv2/pytesseract 非常陌生，经过过多的搜索才能够走到这一步。

import cv2
import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r'C:\Users\hamza.rana\AppData\Local\Tesseract-OCR\tesseract.exe'

image = cv2.imread('captcha.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
gray = cv2.medianBlur(gray, 3)
gray = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
filename = "{}.png".format("temp")
cv2.imwrite(filename, gray)
text = pytesseract.image_to_string(Image.open('temp.png'),config='--psm 13 --oem 3 -c tessedit_char_whitelist=0123456789')
print(text)

Answer 1

Tesseract 的开箱即用培训最适合字体，并且（以我的经验）手工打印效果不佳，而在长手写体上忘记了它。

当事情变得紧张时，稍微有帮助的事情是将边框扩大几个像素。 但是从一个凌乱的 capcha 开始......这可能是你必须训练模型的东西。

Tesseract 无法读取图像中的数字（验证码）

问题描述

1 个解决方案

解决方案1
0 2020-09-05 22:41:39

Tesseract 无法读取图像中的数字（验证码）

问题描述

1 个解决方案

解决方案1 0 2020-09-05 22:41:39

解决方案1
0 2020-09-05 22:41:39