簡體   English   中英

用於Tesseract OCR的PIL預處理

[英]PIL preprocessing for tesseract ocr

如何提高OCR的准確性?

我正在使用pyocr來調用tesseract二進制文件 ,將魔杖將pdf轉換為Image,然后使用Pillow來處理用於OCR的Image。

附上所有圖片

我覺得這是可以完成的最好的預處理。

imgf = img.convert('RGB') #to draw a line in between
draw = Draw(imgf)
x,y = imgf.size
eX,eY = 20,800
box =  (x/2 - eX/2, y/2 - eY/2, x/2 + eX/2, y/2 + eY/2)
draw.ellipse(box, fill=0)
del draw


im2 = imgf.filter(ImageFilter.MinFilter(1))  #filter
im2 = im2.filter(ImageFilter.SMOOTH_MORE)
im2 = im2.filter(ImageFilter.SMOOTH_MORE)

for img in req_image:   # OCR
    txt = tool.image_to_string(
        im2,
        lang=lang,
        builder=pyocr.builders.DigitBuilder()
    )
print text

首先從PDf中裁剪出Image,然后將其轉換為灰度,然后通過以上代碼對其進行處理。

我在兩者之間添加了一行,發現它大大提高了准確性(感覺像是可以的)

1 准確 2 准確 3 不准確的回報6563 8 1 4 pdf的灰度圖像

微軟發布了一個很棒的api,稱為認知服務。 您可以使用它來進行圖像識別。

https://azure.microsoft.com/zh-cn/services/cognitive-services/

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM