Python 無法從圖像中讀取文本 [Python OCR with Tesseract]

Question

我在從圖像中准確讀取兩行數字（每行最多包含 3 位數字）時遇到了這個問題。

我的 Python 代碼在從如下圖像中讀取數據時存在很大問題：

大多數時候它只是打印隨機數。 我應該怎么做才能完成這項工作？

這是我的 Python 代碼：

from PIL import ImageGrab, Image
from datetime import datetime
from pytesseract import pytesseract
import numpy as nm


pytesseract.tesseract_cmd = 'F:\\Tesseract\\tesseract'

while True:
    screenshot = ImageGrab.grab(bbox=(515, 940, 560, 990))
    datetime = datetime.now()
    filename = 'pic_{}.{}.png'.format(datetime.strftime('%H%M_%S'), datetime.microsecond / 500000)

    gray = screenshot.convert('L')
    bw = nm.asarray(gray).copy()

    bw[bw < 160] = 0
    bw[bw >= 160] = 255

    convertedScreenshot = Image.fromarray(bw)

    tesseract = pytesseract.image_to_string(convertedScreenshot, config='digits --psm 6')

    convertedScreenshot.save(filename)

    print(tesseract)

圖像必須在黑色背景上有白色文本或在白色背景上有黑色文本。

之后保存圖像也很重要。

Answer 1

Tesseract 在白色背景上有黑色文本的圖像上效果最好。 通過添加以下行，在使用 tesseract 之前反轉圖像：

 convertedScreenshot = 255 - convertedScreenshot

Python 無法從圖像中讀取文本 [Python OCR with Tesseract]

問題描述

1 個解決方案

解決方案1
0 2020-06-08 09:52:40

Python 無法從圖像中讀取文本 [Python OCR with Tesseract]

問題描述

1 個解決方案

解決方案1 0 2020-06-08 09:52:40

解決方案1
0 2020-06-08 09:52:40