[英]pytesseract - Extracting digits from an image
我是 pytesseract 的新手。 我想從下圖中提取用戶 ID
我正在使用的代碼是:
import cv2
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Users\80141219\AppData\Local\Programs\Tesseract- OCR\tesseract.exe'
image = cv2.imread(r'C:\Desktop\dormancyIssue\testImage.jpg', 0)
thresh = cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
data = pytesseract.image_to_string(thresh, lang='eng',config='--psm 6')
print(data)
cv2.imshow('thresh', thresh)
cv2.waitKey()
輸出是:
wecy| H+ op Et >A EEE
@ Fle] x |
Fite Adion View WN (Gencal
| ale] xX .
x x & ‘
oraputer Manage
4B System Tools TT -
Gf Event Viewer
> gil Shared Folder sities
4B Local Users arg | Members:
To Users Bor 109033
3 Groups | | Soser5405
» @ Performance | | SPs0nss658
Bl device Menagy | | SE70z1611
> ap Windows Senff | | SE 7102
z Bons
Disk Manage
> iy Services and App}
Guages et goin raven
pe) ts) Cerone] ret ster
B& * & &°e «hs
我什至不確定輸出中的某些數據來自哪里。 請注意,我還嘗試裁剪圖像以僅包含 ID,但無濟於事。
我想知道是否有人可能有解決方案或為我指明正確的方向。
謝謝!!
我看到您的 ID 僅由數字組成。 這是tesseract收集數字信息的解決方案。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.