為什么 pytesseract 無法識別這個簡單圖像中的數字？

Question

我正在嘗試使用 pytesseract 從圖像中識別兩個數字：

我試過--psm 6到10
我試過-c tessedit_char_whitelist=0123456789'

以上都不返回49號。 我得到的最接近的是4沒有9

關於如何讓 tesseract 識別它，你有什么技巧嗎？

Answer 1

嘗試--psm 13 --oem 3 （ oem = 1 或 2 也應該這樣做）

import pytesseract
from PIL import Image
import requests
import io

response = requests.get('https://i.stack.imgur.com/oAAXR.png')
text = pytesseract.image_to_string(Image.open(io.BytesIO(response.content)), lang='eng',
                    config='--psm 13 --oem 3 -c tessedit_char_whitelist=0123456789')

print(text)

正如您在我的機器上所期望的那樣產生49 。

我通過在本地下載圖像並觸發得到相同的結果

tesseract oAAXR.png output --oem 3 --psm 13 -l eng

作為參考，我的tesseract --version給出了tesseract 4.0.0 leptonica-1.77.0 libgif 5.1.4: libjpeg 8d (libjpeg-turbo 2.0.1): libpng 1.6.36: libtiff 4.0.10: zlib 1.2.11: libwebp 1.0.1 Found AVX2 Found AVX Found SSE 。

Answer 2

您嘗試過不同--oem嗎？ 我也會嘗試使用高於 10 的--psm 。

Answer 3

對我來說，以下命令只返回4 ：

tesseract oAAXR.png out --dpi 300 --psm 11 --oem 1 -c tessedit_char_whitelist=0123456789

使用：

tesseract 4.1.1-rc2-17-g6343
 leptonica-1.76.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE
 Found libarchive 3.3.3 zlib/1.2.11 liblzma/5.2.4 bz2lib/1.0.6 liblz4/1.8.3 libzstd/1.3.8

為什么 pytesseract 無法識別這個簡單圖像中的數字？

問題描述

3 個解決方案

解決方案1
8 已采納 2019-01-04 20:27:09

解決方案2
1 2019-01-01 22:37:23

解決方案3
1 2019-12-12 17:07:19

為什么 pytesseract 無法識別這個簡單圖像中的數字？

問題描述

3 個解決方案

解決方案1 8 已采納 2019-01-04 20:27:09

解決方案2 1 2019-01-01 22:37:23

解決方案3 1 2019-12-12 17:07:19

解決方案1
8 已采納 2019-01-04 20:27:09

解決方案2
1 2019-01-01 22:37:23

解決方案3
1 2019-12-12 17:07:19