如何在手写文本识别中对数字和单词进行分类

Question

我正在使用神经网络进行手写文本识别，我认为我已经在这方面使用过

用于图像处理的opencv
页面分割和提取文本框
分词（或任何关于更准确的分割/屏蔽文本的建议）

我有一个带有姓名、年龄和出生日期文本框的表格，姓名字段的结果很好（能够识别）但是对于出生日期和年龄，它无法将其完全识别为数字，例如“1”和 '0' 被识别为 'i' 和 'o'。

我如何将其分类为单词和数字，或者我可以仅将任何其他模型用于数字（目前我已经使用 IAM 数据集单词训练了神经网络），或任何建议。

result : --i-16-16-
result : -i-i6-86-

Answer 1

您可以训练另一个神经网络，因为数字识别不是一项计算量相对较大的任务。

或者，如果文档具有固定格式，那么您就会知道年龄和出生日期在哪里。 在这种情况下，在对输出层进行阈值处理以决定输出时，只对表示数字的神经元进行阈值处理。

例如，假设您有 5 个数字{'1','2','3','4','5'}和 5 个字母{'a','e','i','o','u'} 。 经过训练的神经网络的输出层给出[0.38, 0.006, 0.01, 0.004, 0.1, 0.03, 0.009, 0.4, 0.001, 0.06] 。

在其上执行 softmax 以获得概率解释。 并选择一个输出。 相反，仅对表示数字的神经元执行 softmax。 您也可以将其视为先验概率为零。

这里i的激活值高于1 。 但是在执行 softmax 时，您只能选择代表数字的神经元。 因此你得到1 。

如何在手写文本识别中对数字和单词进行分类

问题描述

1 个解决方案

解决方案1
0 2020-01-14 05:58:57

如何在手写文本识别中对数字和单词进行分类

问题描述

1 个解决方案

解决方案1 0 2020-01-14 05:58:57

解决方案1
0 2020-01-14 05:58:57