繁体   English   中英

Pytesseract OCR 错误文本识别

[英]Pytesseract OCR wrong text recognition

当我使用 Pytesseract 识别此图像中的文本时,Pytesseract 返回7A51k但此图像中的文本是7,451k

如何使用代码而不是提供更清晰的源图像来解决此问题?

在此处输入图像描述

我的代码

import pytesseract as pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = 'D:\\App\\Tesseract-OCR\\tesseract'

img = Image.open("captured\\amount.png")
string = pytesseract.image_to_string(image=img, config="--psm 10")

print(string)

我有一个两步解决方案


    1. 调整图像大小
    1. 应用阈值。

    1. 调整图像大小
    • 输入图像太小,无法识别数字、标点和字符。 增加尺寸将实现准确的解决方案。
    1. 应用阈值
    • 阈值化将显示图像的特征。

    • 当您应用阈值结果将是:

      • 在此处输入图像描述

当您读取阈值图像时:

7,451k

代码:


import cv2
from pytesseract import image_to_string

img = cv2.imread("4ARXO.png")
(h, w) = img.shape[:2]
img = cv2.resize(img, (w*3, h*3))
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thr = cv2.threshold(gry, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
txt = image_to_string(thr)
print(txt)

如果调整大小后图像模糊没有问题,您可以对其进行阈值化,并按照AlexAlex的建议进行反转:

output:7,451k

import numpy as np
import pytesseract
import cv2

# Read Image
gray = cv2.imread('2.png', 0)

# Resize
gray = cv2.resize(gray, (600,200))

# Inverting
gray = 255 - gray
emp = np.full_like(gray, 255)
emp -= gray

# Thresholding
emp[emp==0] = 255
emp[emp<100] = 0

text = pytesseract.image_to_string(emp, config='outputbase digits')

print(text)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM