Python OCR Tesseract 无法识别单个字符

Question

我有两个 TIF 图像。 第一张图片（a.tif）是：

和第二个图像（bcd.tif）是

当我使用“tesseract a.tif a.txt”时，它没有读取该字符，并且相同的命令“tesseract bcd.tif bcd.txt”正在运行。我在stackoverflow中看到了一些答案，他们没有给出解决方案运行那个。如果我们需要添加任何参数，那些是什么？

Answer 1

正如您所说，您需要将模式更改为单字符模式，您可以使用以下命令在 python 中执行此操作

pytesseract.image_to_string(img_path , config="--psm 10")

Answer 2

似乎这个问题与图像中只有一个字符有关。 例如，我尝试了这两个图像：

这个很好用。 Tesseract 报告对结果的置信度为 95%：

这个不行。

我还尝试在 PageSegMode 设置为 SingleChar 的情况下扫描该图像，然后扫描正常。

命令行参数应该是-psm 10 。 看到这个： https : //stackoverflow.com/a/26418458/5894241