[英]How to improve handwritten text recognition using pytesseract in small image?
[英]How to classify digits and words in Handwritten Text recognition
您可以训练另一个神经网络,因为数字识别不是一项计算量相对较大的任务。
或者,如果文档具有固定格式,那么您就会知道年龄和出生日期在哪里。 在这种情况下,在对输出层进行阈值处理以决定输出时,只对表示数字的神经元进行阈值处理。
例如,假设您有 5 个数字{'1','2','3','4','5'}
和 5 个字母{'a','e','i','o','u'}
。 经过训练的神经网络的输出层给出[0.38, 0.006, 0.01, 0.004, 0.1, 0.03, 0.009, 0.4, 0.001, 0.06]
。
在其上执行 softmax 以获得概率解释。 并选择一个输出。 相反,仅对表示数字的神经元执行 softmax。 您也可以将其视为先验概率为零。
这里i
的激活值高于1
。 但是在执行 softmax 时,您只能选择代表数字的神经元。 因此你得到1
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.