在大型（PIL + OpenCV）中查找小型图像

Question

我正在尝试按照此处所述进行操作：在Numpy图像中查找子图像，以便能够在屏幕截图中搜索图像。

代码如下所示：

import cv2
import numpy as np
import gtk.gdk
from PIL import Image

def make_screenshot():
    w = gtk.gdk.get_default_root_window()
    sz = w.get_size()
    pb = gtk.gdk.Pixbuf(gtk.gdk.COLORSPACE_RGB, False, 8, sz[0], sz[1])
    pb = pb.get_from_drawable(w, w.get_colormap(), 0, 0, 0, 0, sz[0], sz[1])
    width, height = pb.get_width(), pb.get_height()
    return Image.fromstring("RGB", (width, height), pb.get_pixels())

if __name__ == "__main__":
    img = make_screenshot()
    cv_im = cv2.cvtColor(np.array(img), cv2.COLOR_RGB2BGR)
    template = cv_im[30:40, 30:40, :]
    result = cv2.matchTemplate(cv_im, template, cv2.TM_CCORR_NORMED)
    print np.unravel_index(result.argmax(), result.shape)

根据选择的方法（而不是cv2.TM_CCORR_NORMED），我将获得完全不同的坐标，但是例如，它们都不是（30，30）。

请教我，这种方法有什么问题？

Answer 1

简短的答案：您需要使用以下行找到最匹配的角：

minVal, maxVal, minLoc, maxLoc = cv2.minMaxLoc(result)

变量maxLoc将保存一个元组，其中包含最佳匹配的左上角的x，y索引。

长答案：

cv2.matchTemplate（）返回一个通道图像，其中每个索引处的数字对应于输入图像与该索引处的模板的匹配程度。 通过在调用matchTemplate之后插入以下代码行来尝试可视化结果，您将了解为什么numpy很难理解它。

cv2.imshow("Debugging Window", result)
cv2.waitKey(0)
cv2.destroyAllWindows()

minMaxLoc（）将matchTemplate返回的结果转换为所需的信息。 如果您想知道模板的最差匹配位置，或最佳和最差匹配结果在结果中保留的值，则也可以使用这些值。

该代码对我从文件读取的示例图像有效。 如果您的代码继续出现异常，则可能是您未按照所需的方式读取图像。 上面的代码片段对于使用OpenCV进行调试非常有用。 将imshow中的参数结果替换为任何图像对象（numpy数组）的名称，以直观地确认您正在获取所需的图像。

在大型（PIL + OpenCV）中查找小型图像

问题描述

1 个解决方案

解决方案1
0 2013-08-08 22:52:28

在大型（PIL + OpenCV）中查找小型图像

问题描述

1 个解决方案

解决方案1 0 2013-08-08 22:52:28

解决方案1
0 2013-08-08 22:52:28