簡體   English   中英

使用 Tesseract python 進行數字識別

[英]Digit Recognition with Tesseract python

對於我正在進行的一個項目,我正在嘗試使用 OCR 檢測食物托盤圖像上的數字。 為此,我在 python 中使用了 Tesseract 4。 但它無法正確檢測我擁有的大多數圖像的數字。 我嘗試使用 OpenCV 進行各種圖像預處理,例如模糊、閾值、銳化、腐蝕和膨脹,以提高精度。 但似乎沒有任何效果。 我是計算機視覺的新手,因此對此的任何建議或替代解決方案都會有很大幫助。 我在下面的鏈接中附上了圖片。 提前致謝。

鏈接到圖片

您需要更強大的文本檢測功能,它會為您裁剪文本候選區域。

處理會稍微復雜一些,如下所示:

  1. 運行文本檢測,獲取文本候選區域
  2. 提取該區域
  3. 使用 tesseract 讀取文本

在 OpenCV 的 DNN 模塊內部有一個很棒的文本檢測腳本,稱為: text_detection.py ,它用於 EAST 文本檢測。 使用您的示例圖像,我可以在綠色矩形中提取以下文本候選區域。 所以接下來的步驟就是上面的第2步和第3步。

在此處輸入圖像描述

在此處輸入圖像描述

當然,EAST 沒有針對您的場景進行訓練,因此不可能達到 100% 的准確性。 您可以嘗試為您的場景收集數據並訓練 EAST。 但我認為,默認值會給你 90% 以上的准確率。

希望這有幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM