簡體   English   中英

具有OpenCV和Python的去歪斜文本(RotatedRect,minAreaRect)

[英]Deskew Text with OpenCV and Python (RotatedRect, minAreaRect)

我是OpenCV的新手,我想對具有傾斜文本的圖像進行偏移校正。 首先,我在GrayScale中讀取圖像並將其二值化,然后嘗試執行以下操作

import cv2
import numpy as np

img = cv2.imread('m20.jpg',0)
ret,byw = cv2.threshold(img,127,255,cv2.THRESH_BINARY_INV)
_, contours, hierarchy = cv2.findContours(byw.copy(), cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
cnt = contours[0]
draw = cv2.cvtColor(byw, cv2.COLOR_GRAY2BGR)
rect = cv2.minAreaRect(cnt)
box = cv2.boxPoints(rect)
box = np.int0(box)
cv2.drawContours(draw, [box], 0, (0, 255, 0), 2)

但這是行不通的,因為findContours()希望接收到具有身體形狀的圖像。 我嘗試的其他方法是翻譯此c ++代碼:

// Read image
Mat3b img = imread("path_to_image");

// Binarize image. Text is white, background is black
Mat1b bin;
cvtColor(img, bin, COLOR_BGR2GRAY);

bin = bin < 200;

// Find all white pixels
vector<Point> pts;
findNonZero(bin, pts);

// Get rotated rect of white pixels
RotatedRect box = minAreaRect(pts);
if (box.size.width > box.size.height)
{
    swap(box.size.width, box.size.height);
    box.angle += 90.f;
}

Point2f vertices[4];
box.points(vertices);

for (int i = 0; i < 4; ++i)
{
    line(img, vertices[i], vertices[(i + 1) % 4], Scalar(0, 255, 0));
}

// Rotate the image according to the found angle
Mat1b rotated;
Mat M = getRotationMatrix2D(box.center, box.angle, 1.0);
warpAffine(bin, rotated, M, bin.size());

我有這個:

draw = cv2.cvtColor(byw, cv2.COLOR_GRAY2BGR)
data = np.array(byw)
subzero = np.nonzero(data)
subuno = np.reshape(subzero,(17345,2)) # this is because cv2.minAreaRect() receives a Nx2 numpy
rect = cv2.minAreaRect(subuno)
box = cv2.boxPoints(rect)
box = np.int0(box)
cv2.drawContours(draw,[box],0,(0,255,0),2)

但是話又說回來,結果不是預期的,矩形位置不好。


我也可能會嘗試在C ++中實現for ,但我不知道如何從box = cv2.boxPoints(rect)獲得頂點。 請幫忙!

也許您可以查看以下內容: http : //www.pyimagesearch.com/2014/08/25/4-point-opencv-getperspective-transform-example/

在該鏈接中,作者對整個文檔(以及因此所包含的文本)進行偏斜或變換,但是,這取決於根據圖像中的輪廓找到文檔的邊緣。

他在以下教程中進一步介紹了此方法: http : //www.pyimagesearch.com/2014/09/01/build-kick-ass-mobile-document-scanner-just-5-minutes/

他的解決方案之所以有效,是因為他可以根據檢測到的文檔的位置,方向和傾斜度來調整整個文檔。 整體上調整文檔的位置實際上會調整文檔內發現的所有內容,包括文本。

但是,我相信您要問的是,即使檢測任何文檔邊緣和輪廓,也要對文本進行去歪斜。 如果是這種情況,那么我假設您需要提供其他基礎或標准來使文本進行偏斜校正(即,檢測圖像中是否存在字母,然后檢測字母是否基於您的標准偏斜) ,然后調整字母),這可能不是一個簡單的練習。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM