[英]Algorithms for Photo OCR in Machine Learning
我最近參加了關於課程的機器學習課程,並以不錯的分數通過了該課程。 我在課程中使用了KNN,Logistic回歸,NN等算法,其中一項任務就是編寫我能夠完成的數字識別學習算法。 課程以Photo OCR的案例研究結束,這讓我非常興奮,但我發現很難應用課程中教授的基本算法來解決這個巨大的問題。所以有人能建議我在Photo OCR上使用一些算法嗎?
圖像識別的問題在於它對任何變化都非常敏感。 他們平均人腦能夠從圖像中提取某些特征,即使已經應用了某些圖像操作(例如傾斜,旋轉等),我們也可以識別給定的圖像。
話雖如此,據我所知,人工神經網絡是最廣泛使用的(投入隱藏層或兩層通常也有幫助)。 我聽說的另一種技術是Wisard(或巫師),但我找不到任何關於它的東西。 這種技術基本上將圖像分成幾個部分,然后在將圖像片段與您的知識庫中的內容進行比較時獲得一定的相似度。
話雖這么說,如果我在哪里你會堅持神經網絡加上像OpenCV這樣的體面圖形處理庫(有各種各樣的包裝器,包括Java和C#)。 目的是消除盡可能多的不需要的信息。 例如,在某些情況下,將圖像縮小為灰度或嚴格的黑白像素會有所幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.