[英]Transform an image of handwritten notes to text [on hold]
我有數百張手寫筆記的圖像。 它們是由不同的人寫的,但它們是按順序寫的,所以你知道例如person1
寫了img1.jpg
-> img100.jpg
。 筆跡風格因人而異,但筆記的某些部分始終是固定的,我想這可以幫助算法(它對我有幫助。)。
我嘗試了tesseract
,但它在識別文本方面非常失敗。 我在想,因為每個人都有大約 100 張圖像,我是否可以通過提供少量示例(例如 5 個或更少)來訓練算法,並且可以從中學習? 還是數據不夠? 從四處搜索看來我需要實現一個CNN
(例如本文)。
雖然我對ai
的了解有限,我仍然可以通過圖書館和一些學習來做到這一點嗎? 如果是這樣,我應該怎么做?
這被稱為OCR
,並且已經取得了進展。 實際上,這是一個使用tesseract
將圖像文件解析為文本的簡單示例:
try:
from PIL import Image
except ImportError:
import Image
import pytesseract
def ocr_core(file):
text = pytesseract.image_to_string(file)
return text
print(ocr_core('sample.png'))
我不太確定它是否可以識別不同類型的筆跡。 您可以自己嘗試一下以找出答案。 如果您想嘗試python
示例,您需要導入tesseract
但首先要在您的操作系統上安裝tesseract
並將其添加到您的PATH
。
市面上有很多 OCR,其中一些的性能比其他的好。 然而,這是一個最近隨着深度神經網絡而得到很大改進的領域。 我會考慮使用雲提供商,例如 Azure、Google Cloud 或 Amazon。 您上傳圖片,他們會返回元數據。
例如: https://azure.microsoft.com/en-us/services/cognitive-services/computer-vision/
如果您出於任何原因不想使用雲服務,我會考慮使用 TensorFlow... 但需要一些知識:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.