簡體   English   中英

PyTesseract 和 Tesseract 未檢測到文本

[英]PyTesseract and Tesseract not detecting text

我一直在嘗試將 pytesseract 用於我已經從事了很長一段時間的項目。 到目前為止,我一直在努力確保它在我的計算機上運行良好,但我沒有讓它運行起來。

我一直在嘗試使用以下代碼在圖像上對其進行測試:

image = cv2.imread('exit.png',cv2.IMREAD_GRAYSCALE)
th,image = cv2.threshold(image,0,255,cv2.THRESH_OTSU)
image = 255 - image
cv2.imshow('bruh',image)
cv2.waitKey(0)
print(pytesseract.image_to_data(image,config='--psm 3 --oem 3'))

這段代碼的目的是通過讀取圖像、對其進行二值化然后翻轉黑白值來簡單地測試 pytesseract 是否正常工作,因為我在某處讀到 tesseract 對黑色文本效果更好。 處理后的圖像如下所示

我嘗試過使用和不使用二值化運行圖像,我嘗試重新安裝 tesseract 和 pytesseract,我嘗試了不同的配置,我嘗試通過命令行在圖像上運行 tesseract,但此時我老實說,不知道發生了什么。

我在 Pop!_OS 上使用 Python 版本 3.10.4。

對於您的情況,我嘗試了使用簡單 ocr的 OCR,它還使用 tesseract 引擎提取文本。我得到了正確的結果。 您可以通過pip install easyocr

import cv2
import easyocr
image = cv2.imread('exit.png')
resize = cv2.resize(image,(100,40))
cv2.imwrite('resize.png', resize)
reader = easyocr.Reader(['en'], gpu=False)
result = reader.readtext('resize.png')
for detection in result:
    print(detection)

輸出是

([[5, 0], [93, 0], [93, 40], [5, 40]], 'EXIT', 0.8129605341987216)

我希望這可以幫助你。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM