繁体   English   中英

如何为HAAR训练准备正面图像以进行手部检测?

[英]How should I prepare positive images for HAAR training for hand detection?

我正在使用此数据集: http : //www.robots.ox.ac.uk/~vgg/data/hands/

但是,我只会使用面积大于4200平方像素的手,这只剩下621手。 我意识到这可能还不够,如果需要,我会寻找更多图像。 但是,所有图像的注释如下:

在此处输入图片说明

我有如下边界框的坐标: 在此处输入图片说明

但是,边界框未与x&y轴对齐。

我相信我必须从图像中剪裁出来。 我有两种方法可以做到这一点:

1)令xmin和xmax为边界框的最小和最大x坐标。 而ymin和ymax是边界框的最小和最大y坐标。 如果这样做,我将得到:

在此处输入图片说明 (当然,没有边界框),背景的某些部分仍保留在上面。

2)我可以使用二进制遮罩“遮蔽”边界框内的所有像素。如果这样做,我图像的大小仍将是xmin到xmax和ymin到ymax,但是我可以设置其余部分背景为白色。

有什么会更好? 我相信正面应该只包含感兴趣的对象(在这种情况下为手),所以离开背景可能不对吗? 但是,白色背景还可以吗?

这里的主要问题是边界框未对齐!

可以保留少量背景,但每个图像中的背景会有所不同,因此不会作为分类器的一部分创建。

我建议做一个更大的负片来抵消背景,并且620张图像就可以了。

您可能还想看看labelme http://labelme.csail.mit.edu/Release3.0/index.php

我在项目中使用了它,它们还向您展示了如何使用Amazon Turk获取自己的数据集。 我认为您也许也可以使用他们的数据集。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM