如何在 Python 中使用 OCR 提取數字或數字

Question

我嘗試使用 OCR 提取數字。

開發環境由 pycharm（Python 版本 3）運行。

我的問題是如何使用 OCR 提取數字。

圖像如下所示：

輸入圖像

在上圖中，我想獲得以下數字文本：

1 2   3
4 5 6 7
8 9   0

我怎樣才能得到我想要的結果？

Answer 1

有一系列庫可以實現這一點，這里有一個示例： https: //pypi.org/project/pytesseract/https://github.com/madmaze/pytesseract

try:
    from PIL import Image
except ImportError:
    import Image
import pytesseract

# If you don't have tesseract executable in your PATH, include the following:
pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
# Example tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract'

# Simple image to string
print(pytesseract.image_to_string(Image.open('test.png')))

Answer 2

您可以通過 Otsu 的閾值獲得二值圖像然后提取每個數字。 閾值化后我們得到這個

現在我們遍歷輪廓並提取/保存每個 ROI

現在您可以應用所需的 OCR 工具來讀取每個 ROI 上的文本

import cv2

image = cv2.imread('1.jpg', 0)
thresh = cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
for c, num in zip(cnts, range(len(cnts))):
    x,y,w,h = cv2.boundingRect(c)
    ROI = 255 - thresh[y:y+h, x:x+w]
    cv2.imwrite('ROI_{}.png'.format(num), ROI)

cv2.imshow('thresh', 255 - thresh)
cv2.waitKey()

如何在 Python 中使用 OCR 提取數字或數字

問題描述

2 個解決方案

解決方案1
0 2019-11-07 12:43:22

解決方案2
0 2019-11-08 02:49:46

如何在 Python 中使用 OCR 提取數字或數字

問題描述

2 個解決方案

解決方案1 0 2019-11-07 12:43:22

解決方案2 0 2019-11-08 02:49:46

解決方案1
0 2019-11-07 12:43:22

解決方案2
0 2019-11-08 02:49:46