PyTesseract 和 Tesseract 未檢測到文本

Question

我一直在嘗試將 pytesseract 用於我已經從事了很長一段時間的項目。 到目前為止，我一直在努力確保它在我的計算機上運行良好，但我沒有讓它運行起來。

我一直在嘗試使用以下代碼在此圖像上對其進行測試：

image = cv2.imread('exit.png',cv2.IMREAD_GRAYSCALE)
th,image = cv2.threshold(image,0,255,cv2.THRESH_OTSU)
image = 255 - image
cv2.imshow('bruh',image)
cv2.waitKey(0)
print(pytesseract.image_to_data(image,config='--psm 3 --oem 3'))

這段代碼的目的是通過讀取圖像、對其進行二值化然后翻轉黑白值來簡單地測試 pytesseract 是否正常工作，因為我在某處讀到 tesseract 對黑色文本效果更好。 處理后的圖像如下所示。

我嘗試過使用和不使用二值化運行圖像，我嘗試重新安裝 tesseract 和 pytesseract，我嘗試了不同的配置，我嘗試通過命令行在圖像上運行 tesseract，但此時我老實說，不知道發生了什么。

我在 Pop!_OS 上使用 Python 版本 3.10.4。

Answer 1

對於您的情況，我嘗試了使用簡單 ocr的 OCR，它還使用 tesseract 引擎提取文本。我得到了正確的結果。 您可以通過pip install easyocr 。

import cv2
import easyocr
image = cv2.imread('exit.png')
resize = cv2.resize(image,(100,40))
cv2.imwrite('resize.png', resize)
reader = easyocr.Reader(['en'], gpu=False)
result = reader.readtext('resize.png')
for detection in result:
    print(detection)

輸出是

([[5, 0], [93, 0], [93, 40], [5, 40]], 'EXIT', 0.8129605341987216)

我希望這可以幫助你。

PyTesseract 和 Tesseract 未檢測到文本

問題描述

1 個解決方案

解決方案1
0 已采納 2022-07-16 04:41:05

PyTesseract 和 Tesseract 未檢測到文本

問題描述

1 個解決方案

解決方案1 0 已采納 2022-07-16 04:41:05

解決方案1
0 已采納 2022-07-16 04:41:05