[英]Training Tesseract for Captcha Recognition
目前,只有使用 --psm12 配置,Tesseract 才能以大约 25% 的准确率读取我的验证码。
我已经收集了数据并想训练 tesseract 以便它可以更准确地读取我的图像。
查看原始图像文件: https://imgur.com/a/UQ8iCOa
查看过滤后的图像文件: https://imgur.com/a/3UQ2VtD
我似乎找不到任何关于如何从图像中训练数据的教程? 也欢迎任何关于改进图像处理的建议!
首先,我会尝试去除小点并填补空白以消除干扰。 看看这里你是怎么做到的: FillGapHowTo
第二:如果将字母分开,OCR 可能会运行得更好: 可以这样完成
第三:如果没有任何效果,您可以使用神经网络进行非常难的验证码: 这里
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.