如何通過tesseract OCR讀取黑色背景圖像上的黑色文本？

Question

我在黑色背景圖像上有黑色文字，我想通過OCR讀取它。 不幸的是，OCR無法完美閱讀。 圖像看起來像這樣。 我想將小於（90，90，90，255）的RGBA值轉換為（255，255，255，255），以便它變成黑白。轉換它的代碼是什么？

Answer 1

您需要做的是在讓tesseract發揮作用之前將整個圖像變成黑白。

閱讀圖片

import cv2
im_gray = cv2.imread('your_image_here', cv2.IMREAD_GRAYSCALE)

將其設為灰度

(thresh, im_bw) = cv2.threshold(im_gray, 128, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)

“它使用Otsu的方法從圖像自動確定閾值，或者如果您已經知道閾值，則可以使用：”

thresh = 127
im_bw = cv2.threshold(im_gray, thresh, 255, cv2.THRESH_BINARY)[1]

寫入磁盤

cv2.imwrite('bw_image.png', im_bw)

從這里取

Answer 2

您可以通過簡單的轉換將灰色像素轉換為白色像素。 如果您不想使用開放式簡歷，並且圖像是一個通道（灰度級）的numpy數組：

threshold = 60 # try something between 30 and 150
vect_func = np.vectorize(lambda x: 0 if x == threshold else 255)
black_white_img = vect_func(gray_scale_image)

如何通過tesseract OCR讀取黑色背景圖像上的黑色文本？

問題描述

2 個解決方案

解決方案1
3 已采納 2019-05-31 02:35:57

解決方案2
0 2019-05-31 02:43:43

如何通過tesseract OCR讀取黑色背景圖像上的黑色文本？

問題描述

2 個解決方案

解決方案1 3 已采納 2019-05-31 02:35:57

解決方案2 0 2019-05-31 02:43:43

解決方案1
3 已采納 2019-05-31 02:35:57

解決方案2
0 2019-05-31 02:43:43