如何在完全透明的对象中找到矩形？

Question

我有一个完全透明对象的输入图像：

我需要检测这张图片中的 42 个矩形。 这是我需要的输出图像的一个示例（我标记了 6 个矩形以便更好地理解）：

问题是矩形看起来真的不同。 我必须使用这个输入图像。 我怎样才能做到这一点？

编辑1：这是一个输入图像为png：

Answer 1

如果您计算沿行和跨列的方差，请使用：

import cv2
import numpy as np

im = cv2.imread('YOURIMAGE', cv2.IMREAD_GRAYSCALE)

# Calculate horizontal and vertical variance
h = np.var(im, axis=1)
v = np.var(im, axis=0)

您可以绘制它们并希望找到应该是您的对象的方差峰值：

Answer 2

Mark Setchell 的想法是开箱即用的。 这是一种更传统的方法。

方法：

图像包含强度在较低行中逐渐消失的框。 由于考虑了整个图像的强度变化，因此在这里使用全局均衡将失败。 我在 OpenCV 中选择了一种局部均衡方法，可用作CLAHE（对比度有限自适应直方图均衡））

使用 CLAHE：

均衡应用于图像的各个区域，其大小可以预定义。
为了避免过度放大，应用了对比度限制（因此得名）。

让我们看看如何在我们的问题中使用它：

代码：

# read image and store green channel
green_channel = img[:,:,1]

# grid-size for CLAHE
ts = 8
# initialize CLAHE function with parameters
clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(ts, ts))
# apply the function
cl = clahe.apply(green_channel)

请注意上图，下部区域的框看起来像预期的那样稍暗。 这将对我们以后有所帮助。

# apply Otsu threshold
r,th_cl = cv2.threshold(cl, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

# dilation performed using vertical kernels to connect disjoined boxes
vertical_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (1, 3))
dilate = cv2.dilate(th_cl, vertical_kernel, iterations=1)

# find contours and draw bounding boxes
contours, hierarchy = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)
img2 = img.copy()
for c in contours:
    area = cv2.contourArea(c)
    if area > 100:
        x, y, w, h = cv2.boundingRect(c)
        img2 = cv2.rectangle(img2, (x, y), (x + w, y + h), (0,255,255), 1)

（最右上角的框没有正确覆盖。您需要调整各种参数以获得准确的结果）

您可以尝试的其他预处理方法：

全球均衡
对比拉伸
正常化

如何在完全透明的对象中找到矩形？

问题描述

2 个解决方案

解决方案1
4 2022-06-08 14:24:36

解决方案2
1 2022-06-08 16:07:58

如何在完全透明的对象中找到矩形？

问题描述

2 个解决方案

解决方案1 4 2022-06-08 14:24:36

解决方案2 1 2022-06-08 16:07:58

解决方案1
4 2022-06-08 14:24:36

解决方案2
1 2022-06-08 16:07:58