繁体 English 中英

Tesseract无法识别验证码文本

[英]Tesseract can not recognize captcha text

原文 2019-04-17 00:32:15 1 1 python/ python-3.x/ opencv/ tesseract/ python-tesseract

我试图识别验证码中的文字，这对我来说是不可能的。 我正在使用python3，openCv和tesseract。

简化的代码是：

import cv2                                                           
from pytesseract import *

img_path = "path"

img = cv2.imread(img_path)
img = cv2.resize(img, None, fx=2, fy=2, interpolation=cv2.INTER_LINEAR)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

pytesseract.image_to_string(img)

我想我应该首先删除颜色线，然后单独留下文字，并可能改变亮度和对比度。 什么过滤器适用？

这些是一些要识别的图像。

1 个解决方案

要使用pytesseract-ocr识别验证码文本，您可以执行以下操作。

准备自定义train_set以训练您的tesseract实例以识别特定字体[可选]
验证码图像需要一些预处理（例如*应用黑白滤镜>比例（向上）>模糊>形态转换+自适应阈值*）来增强文本部分并减少噪声/线条。
删除线条：在样本图像中，只有文本可以看到黑色，没有黑线，所以你可以通过使用PIL或OpenCV简单地将每个非黑色像素转换为白色，你甚至可以使用一些特定的算法像Hough Line Transform一样检测和删除线条。

您可以从OpenCV网站上的官方文档和教程中了解所有这些过滤器和算法。

试图在 python 中使用 OpenCV 和 Tesseract 识别 Captcha，但准确度不高

[英]Trying to recognize Captcha with OpenCV & Tesseract in python, but not good Accuracy

Python Tesseract无法识别此字体

[英]Python Tesseract can't recognize this font

Tesseract 无法识别感叹号

[英]Tesseract can't recognize exclamation marks

用于验证码识别的训练 Tesseract

[英]Training Tesseract for Captcha Recognition

tesseract 在白名单后无法识别单个文本段

[英]tesseract doesnt recognize individual text segments after whitelisting

为什么 Tesseract 不能识别车牌上的文字，而 easyocr 可以？

[英]Why does Tesseract not recognize the text on the licence plate while easyocr does?

无法正确识别车牌（Python、OpenCv、Tesseract）

[英]can't recognize correctly license plate (Python, OpenCv, Tesseract)

Tesseract无法清晰地清除图像后无法识别图像

[英]Tesseract can't recognize image after Clearing image incomprehensibly

使用 Tesseract 识别页面上的单个字符

[英]Recognize single characters on a page with Tesseract

Tesseract RuntimeError：无法识别图片

[英]Tesseract RuntimeError: Failed recognize picture

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 试图在 python 中使用 OpenCV 和 Tesseract 识别 Captcha，但准确度不高 Python Tesseract无法识别此字体 Tesseract 无法识别感叹号用于验证码识别的训练 Tesseract tesseract 在白名单后无法识别单个文本段为什么 Tesseract 不能识别车牌上的文字，而 easyocr 可以？无法正确识别车牌（Python、OpenCv、Tesseract） Tesseract无法清晰地清除图像后无法识别图像使用 Tesseract 识别页面上的单个字符 Tesseract RuntimeError：无法识别图片

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM