如何在手寫文本識別中對數字和單詞進行分類

Question

我正在使用神經網絡進行手寫文本識別，我認為我已經在這方面使用過

用於圖像處理的opencv
頁面分割和提取文本框
分詞（或任何關於更准確的分割/屏蔽文本的建議）

我有一個帶有姓名、年齡和出生日期文本框的表格，姓名字段的結果很好（能夠識別）但是對於出生日期和年齡，它無法將其完全識別為數字，例如“1”和 '0' 被識別為 'i' 和 'o'。

我如何將其分類為單詞和數字，或者我可以僅將任何其他模型用於數字（目前我已經使用 IAM 數據集單詞訓練了神經網絡），或任何建議。

result : --i-16-16-
result : -i-i6-86-

Answer 1

您可以訓練另一個神經網絡，因為數字識別不是一項計算量相對較大的任務。

或者，如果文檔具有固定格式，那么您就會知道年齡和出生日期在哪里。 在這種情況下，在對輸出層進行閾值處理以決定輸出時，只對表示數字的神經元進行閾值處理。

例如，假設您有 5 個數字{'1','2','3','4','5'}和 5 個字母{'a','e','i','o','u'} 。 經過訓練的神經網絡的輸出層給出[0.38, 0.006, 0.01, 0.004, 0.1, 0.03, 0.009, 0.4, 0.001, 0.06] 。

在其上執行 softmax 以獲得概率解釋。 並選擇一個輸出。 相反，僅對表示數字的神經元執行 softmax。 您也可以將其視為先驗概率為零。

這里i的激活值高於1 。 但是在執行 softmax 時，您只能選擇代表數字的神經元。 因此你得到1 。

如何在手寫文本識別中對數字和單詞進行分類

問題描述

1 個解決方案

解決方案1
0 2020-01-14 05:58:57

如何在手寫文本識別中對數字和單詞進行分類

問題描述

1 個解決方案

解決方案1 0 2020-01-14 05:58:57

解決方案1
0 2020-01-14 05:58:57