簡體   English   中英

復雜背景下的 OCR 時間戳提取

[英]OCR Time stamp extraction with complex background

這是從 CCTV 視頻中截取的圖像,我想從快照中提取時間戳。 OpenCV/Tesseract/python 是這項工作的工具: 復雜背景的閉路電視快照

這里的困難是復雜的背景,所以即使我使用中值文件過濾器(opencv)對圖片進行二值化,ocr結果仍然很糟糕。 當然,我可以應用特定的自定義閾值,但在這里我遇到了兩個問題:

  1. 如何處理白色和黑色的字符?
  2. 有沒有辦法(某些方法)為這些類型的圖片提供更一般的閾值?

也許我在這里處理預處理的想法是不正確的。 在發送到 Tesseract 之前對這種圖像進行預處理似乎不是一件容易的事。 任何提示和想法都值得感謝。

  1. 做兩次閾值處理,一次通常是254以上的白色像素,一次是倒置圖片: img = cv2.bitwise_not(img) ,然后合並兩個結果

  2. OpenCV 中有一個inRange函數,您可以在其中設置最小/最大 HSV 值。 使用 HSV 值的輸入參數創建一個函數,將值記錄在列表中,然后使用for循環迭代屏蔽+合並

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM