繁体   English   中英

用于验证码识别的训练 Tesseract

[英]Training Tesseract for Captcha Recognition

目前,只有使用 --psm12 配置,Tesseract 才能以大约 25% 的准确率读取我的验证码。

我已经收集了数据并想训练 tesseract 以便它可以更准确地读取我的图像。

查看原始图像文件: https://imgur.com/a/UQ8iCOa

查看过滤后的图像文件: https://imgur.com/a/3UQ2VtD

我似乎找不到任何关于如何从图像中训练数据的教程? 也欢迎任何关于改进图像处理的建议!

首先,我会尝试去除小点并填补空白以消除干扰。 看看这里你是怎么做到的: FillGapHowTo

第二:如果将字母分开,OCR 可能会运行得更好: 可以这样完成

第三:如果没有任何效果,您可以使用神经网络进行非常难的验证码: 这里

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM