PyTesseract 和 Tesseract 未检测到文本

Question

我一直在尝试将 pytesseract 用于我已经从事了很长一段时间的项目。 到目前为止，我一直在努力确保它在我的计算机上运行良好，但我没有让它运行起来。

我一直在尝试使用以下代码在此图像上对其进行测试：

image = cv2.imread('exit.png',cv2.IMREAD_GRAYSCALE)
th,image = cv2.threshold(image,0,255,cv2.THRESH_OTSU)
image = 255 - image
cv2.imshow('bruh',image)
cv2.waitKey(0)
print(pytesseract.image_to_data(image,config='--psm 3 --oem 3'))

这段代码的目的是通过读取图像、对其进行二值化然后翻转黑白值来简单地测试 pytesseract 是否正常工作，因为我在某处读到 tesseract 对黑色文本效果更好。 处理后的图像如下所示。

我尝试过使用和不使用二值化运行图像，我尝试重新安装 tesseract 和 pytesseract，我尝试了不同的配置，我尝试通过命令行在图像上运行 tesseract，但此时我老实说，不知道发生了什么。

我在 Pop!_OS 上使用 Python 版本 3.10.4。

Answer 1

对于您的情况，我尝试了使用简单 ocr的 OCR，它还使用 tesseract 引擎提取文本。我得到了正确的结果。 您可以通过pip install easyocr 。

import cv2
import easyocr
image = cv2.imread('exit.png')
resize = cv2.resize(image,(100,40))
cv2.imwrite('resize.png', resize)
reader = easyocr.Reader(['en'], gpu=False)
result = reader.readtext('resize.png')
for detection in result:
    print(detection)

输出是

([[5, 0], [93, 0], [93, 40], [5, 40]], 'EXIT', 0.8129605341987216)

我希望这可以帮助你。

PyTesseract 和 Tesseract 未检测到文本

问题描述

1 个解决方案

解决方案1
0 已采纳 2022-07-16 04:41:05

PyTesseract 和 Tesseract 未检测到文本

问题描述

1 个解决方案

解决方案1 0 已采纳 2022-07-16 04:41:05

解决方案1
0 已采纳 2022-07-16 04:41:05