簡體   English   中英

pytesseract 無法識別圖像中的數字,

[英]pytesseract can't recognise digits from a image,

我要分析的圖像如下:

在此處輸入圖像描述

我正在運行這段代碼:

from PIL import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'

my_image = 'C:\\autobot_wwe_supercard\\imagenes\\codigo_arriba.png'
text = pytesseract.image_to_string(Image.open(my_image))

print(text)

給我的結果是:

在此處輸入圖像描述

我已經通過控制台安裝了 pytesseract,pip install pytesseract。

>>> img = cv2.imread("1299.png")
>>> gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
>>> thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)[1]
>>> thresh = 255 - thresh
>>> data = pytesseract.image_to_string(thresh, config='--psm 11 digits')
>>> data
'1299'
>>>

嘗試將配置中的數字列入白名單。 pytesseract 有時也能夠提取黑色背景上的白色文本。

pytesseract 不是最佳選擇。 裁剪感興趣區域時,嘗試在文本周圍放置一些填充。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM