从图像中读取文本

Question

我有一张这样的照片：

验证码

我试图用 Python 中的pytesseract阅读它：

from PIL import Image
import pytesseract
import numpy 
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
im = Image.open("11.jpg")
text = pytesseract.image_to_string(im,lang = "eng")
print(text)

但是pytesseract无法读取它。 我也尝试过opencv但找不到解决方案。

Answer 1

在对图像应用 OCR 之前，您需要对图像进行预处理。 一种简单的预处理方法是将图像放大，使用 Otsu 阈值获得二值图像，执行形态学操作，然后对图像进行 OCR。

放大、高斯模糊和大津阈值

变形打开

变形关闭

反转、应用轻微模糊和 OCR

从Pytesseract OCR结果image_to_string使用--psm 6配置选项来处理图像作为单个文本块。

xc2kc2

代码

import cv2
import pytesseract
import imutils

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

# Resize, grayscale, Gaussian blur, Otsu's threshold
image = cv2.imread('1.jpg')
image = imutils.resize(image, width=400)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray, (5,5), 0)
thresh = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

# Perform morphological operations
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=1)
close = cv2.morphologyEx(opening, cv2.MORPH_CLOSE, kernel, iterations=3)

# Invert, Blur, and perform text extraction
invert = 255 - cv2.GaussianBlur(close, (3,3), 0)
data = pytesseract.image_to_string(invert, lang='eng',config='--psm 6')
print(data)

cv2.imshow('thresh', thresh)
cv2.imshow('opening', opening)
cv2.imshow('close', close)
cv2.imshow('invert', invert)
cv2.waitKey()

Answer 2

这个博客有一篇博文提到尝试使用tesseract 、 gocr和ocrad来阅读验证码文本。

关键步骤是在尝试阅读图像之前清理图像。 该站点上给出的示例使用了一个简单的阈值过滤器，但由于您的图像是彩色的，可能效果不佳。

您应该尝试不同的图像处理技术，看看是否可以充分清理图像以识别文本。

说了以上，我会回应@SiHa的评论，并建议这种活动是不道德的。 试图破坏 CAPTCHA 保护表明对服务器所有者缺乏尊重，无论他们这样做是为了保护他们的带宽还是他们的业务。

从图像中读取文本

问题描述

2 个解决方案

解决方案1
2 已采纳 2020-02-03 22:22:14

解决方案2
0 2020-02-02 17:40:32

从图像中读取文本

问题描述

2 个解决方案

解决方案1 2 已采纳 2020-02-03 22:22:14

解决方案2 0 2020-02-02 17:40:32

解决方案1
2 已采纳 2020-02-03 22:22:14

解决方案2
0 2020-02-02 17:40:32