为什么 pytesseract 无法识别此图像

Question

我正在这张图片上测试 pytesseract OCR

但结果总是 30770.0 但我想要这个数字：997,70 仅供参考：这张图片已经被转换了：

img = img.convert('L')  # greyscale
img = img.resize((img.size[0] * 3, img.size[1] * 3), 1)
img = ImageEnhance.Contrast(img).enhance(5.0)
img = ImageOps.equalize(img)
img = ImageOps.invert(img)

代码下方：

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'
img2 = "full_snap__1609584655.png"
numStr2 = pytesseract.image_to_string(img2, lang='eng',config='--psm 10 --oem 1 digits -c tessedit_char_whitelist=0123456789')
print('997,70 :',float(numStr2))

我已经尝试调整 pytesseract function image_to_string 的 --psm 参数，但它不起作用。

谢谢您的帮助

Answer 1

我对这个问题的解决方案是形态转换。

如果你应用侵蚀

前景 object 的厚度或大小减小或图像中的白色区域减小。 它对于去除小的白噪声（正如我们在色彩空间章节中所见）、分离两个连接的对象等很有用。

erd = cv2.erode(gry, None, iterations=1)

结果：

现在，如果您阅读它：

print(pytesseract.image_to_string(erd))

结果：

997 70€

代码：

import cv2
import pytesseract

img = cv2.imread("R83OY.png")
h, w, c = img.shape
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
erd = cv2.erode(gry, None, iterations=1)
print(pytesseract.image_to_string(erd))

可能的问题：为什么将 kernel 设置为 None？

如果初始化 kernel （即 (5, 5) ）并将其应用于图像，结果将是：

如您所见，应用 kernel 并没有改善结果。

为什么 pytesseract 无法识别此图像

问题描述

1 个解决方案

解决方案1
2 2021-01-04 12:03:15

为什么 pytesseract 无法识别此图像

问题描述

1 个解决方案

解决方案1 2 2021-01-04 12:03:15

解决方案1
2 2021-01-04 12:03:15