簡體   English   中英

Pytesseract 甚至無法識別非常簡單的文本行

[英]Pytesseract can not recognize even very simple textline

二進制圖像 B2二進制圖像 Y2

我認為這些圖像非常簡單明了。 仍然 pytesseract 不起作用。 我真的想知道為什么。

這是我的代碼

from pytesseract import pytesseract as tesseract
import cv2 as cv

binary = cv.imread(filepath)

lang = 'eng'
config = 'tessedit_char_whitelist=RGB123'
print(tesseract.image_to_string(binary, lang=lang, config=config))

輸出只是空字符串。

對於 Dennlinger 的觀點,我肯定會在通過 PyTess 發送之前對其進行旋轉。 不過 PyTess應該自動旋轉它。 應該。

或者,我在您的配置中看到您將“RGB123”列入白名單,如果我錯了,請糾正我,這可能意味着 PyTess 主要是在尋找那些特定的數字和字符。

我會嘗試通過省略該配置來更改您的配置,以便它可以在那里選擇“Y”。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM