繁体   English   中英

Pytesseract 的 Python OCR 问题

[英]Python OCR issues with Pytesseract

我试图读取出现在屏幕上的一些字符,但我的尝试都没有成功。 示例图像在这里

这是我的代码:

import pytesseract as tess
tess.pytesseract.tesseract_cmd = r'C:\Users\myuser\AppData\Local\Tesseract-OCR\tesseract.exe'
from PIL import Image


img = Image.open(r'E:\images\numbers.PNG')
text = tess.image_to_string(img)

print(text)

显示的“垃圾”输出是:

C NCES IC DICIIED)
CK STOO TEED
@©O®D@O@O@O@O®

我想这是因为数字的颜色以及它们可能出现的不同背景图像而发生的。

不幸的是,我不知道如何进一步进行以及如何让它发挥作用。

你能帮忙吗? 非常感谢您的帮助!

谢谢!

我现在没有安装 Tesseract,但尝试使用此代码的结果:

import cv2

img = cv2.imread('img.png')

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

thresh = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV, 3, 6)
cv2.imshow('threshold', thresh)

cv2.waitKey(0)

您可以对其进行微调以实现您的结果。

脱粒

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM