繁体   English   中英

python 中的数字识别(OpenCV 和 pytesseract)

[英]Digit recognition in python (OpenCV and pytesseract)

我目前正在尝试从小屏幕截图中检测数字。 但是,我发现准确性很差。 我一直在使用 OpenCV,图像以 RGB 格式捕获并转换为灰度,然后使用全局值执行阈值处理(我发现自适应效果不太好)。

这是其中一个数字的灰度示例,然后是图像后阈值保持的示例(数字范围为 1-99)。 请注意,图像的初始屏幕截图非常小,因此被放大了。

在此处输入图像描述

在此处输入图像描述

非常感谢有关如何使用 OpenCV 或其他不同系统来提高准确性的任何建议。 下面包含的一些代码,function 传递了数字的 RGB 屏幕截图。

def getNumber(image):
    image = cv2.resize(image, (0, 0), fx=3, fy=3)
    img = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    thresh, image_bin = cv2.threshold(img, 125, 255, cv2.THRESH_BINARY)

    image_final = PIL.Image.fromarray(image_bin)

    txt = pytesseract.image_to_string(
        image_final, config='--psm 13 --oem 3 -c tessedit_char_whitelist=0123456789')
    return txt

这是我可以改进的地方,使用 otsu 阈值比给出任意值更有效地将文本与背景分开。 Tesseract 对白色背景上的黑色文本效果更好,而且我还添加了填充,因为如果字符太靠近边界,则 tesseract 难以识别字符。

这是最终图像 [final_image][1] 和 pytesseract 设法读取“46”

import cv2,numpy,pytesseract
def getNumber(image):
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    
    # Otsu Tresholding automatically find best threshold value
    _, binary_image = cv2.threshold(gray, 0, 255, cv2.THRESH_OTSU)
    
    # invert the image if the text is white and background is black
    count_white = numpy.sum(binary_image > 0)
    count_black = numpy.sum(binary_image == 0)
    if count_black > count_white:
        binary_image = 255 - binary_image
        
    # padding
    final_image = cv2.copyMakeBorder(image, 10, 10, 10, 10, cv2.BORDER_CONSTANT, value=(255, 255, 255))
    txt = pytesseract.image_to_string(
        final_image, config='--psm 13 --oem 3 -c tessedit_char_whitelist=0123456789')

    return txt

Function 执行如下:

>> getNumber(cv2.imread(img_path))

编辑:请注意,您不需要这一行:

image_final = PIL.Image.fromarray(image_bin)

因为您可以将 numpy 数组格式(使用 cv2)的图像传递给 pytesseractr,而 Tesseract 的精度只会下降 35 像素以下的字符(而且更大,35px 高度实际上是最佳高度)所以我没有调整它的大小。 [1]: https://i.stack.imgur.com/OaJgQ.png

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM