[英]How to improve handwritten text recognition using pytesseract in small image?
[英]How to classify digits and words in Handwritten Text recognition
您可以訓練另一個神經網絡,因為數字識別不是一項計算量相對較大的任務。
或者,如果文檔具有固定格式,那么您就會知道年齡和出生日期在哪里。 在這種情況下,在對輸出層進行閾值處理以決定輸出時,只對表示數字的神經元進行閾值處理。
例如,假設您有 5 個數字{'1','2','3','4','5'}
和 5 個字母{'a','e','i','o','u'}
。 經過訓練的神經網絡的輸出層給出[0.38, 0.006, 0.01, 0.004, 0.1, 0.03, 0.009, 0.4, 0.001, 0.06]
。
在其上執行 softmax 以獲得概率解釋。 並選擇一個輸出。 相反,僅對表示數字的神經元執行 softmax。 您也可以將其視為先驗概率為零。
這里i
的激活值高於1
。 但是在執行 softmax 時,您只能選擇代表數字的神經元。 因此你得到1
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.