繁体 English 中英

用于验证码识别的训练 Tesseract

[英]Training Tesseract for Captcha Recognition

原文 2021-12-06 16:59:00 3 1 python/ image-processing/ ocr/ tesseract/ captcha

目前，只有使用 --psm12 配置，Tesseract 才能以大约 25% 的准确率读取我的验证码。

我已经收集了数据并想训练 tesseract 以便它可以更准确地读取我的图像。

查看原始图像文件： https://imgur.com/a/UQ8iCOa

查看过滤后的图像文件： https://imgur.com/a/3UQ2VtD

我似乎找不到任何关于如何从图像中训练数据的教程？ 也欢迎任何关于改进图像处理的建议！

首先，我会尝试去除小点并填补空白以消除干扰。 看看这里你是怎么做到的： FillGapHowTo

第二：如果将字母分开，OCR 可能会运行得更好：可以这样完成

第三：如果没有任何效果，您可以使用神经网络进行非常难的验证码：这里

使用 Tesseract python 进行数字识别

[英]Digit Recognition with Tesseract python

[英]Best Practice in Captcha Recognition

[英]Low accuracy on captcha recognition

[英]Tesseract can not recognize captcha text

[英]Training Tesseract OCR for ambiguities

[英]Digit recognition with Tesseract OCR and python

[英]Python Tesseract License Plate Recognition

[英]Training the facial recognition model

[英]Using Python and Tesseract OCR to solve Captcha

[英]Error converting Simple Captcha to string using tesseract

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用 Tesseract python 进行数字识别验证码识别最佳实践验证码识别精度低 Tesseract无法识别验证码文本培训Tesseract OCR以消除歧义使用Tesseract OCR和python进行数字识别 Python Tesseract 车牌识别训练人脸识别模型使用Python和Tesseract OCR解决验证码使用tesseract将Simple Captcha转换为字符串时出错

相关标签