![](/img/trans.png)
[英]How many images should be there in the training and testing phase? LibSVM
[英]How should I prepare positive images for HAAR training for hand detection?
我正在使用此数据集: http : //www.robots.ox.ac.uk/~vgg/data/hands/
但是,我只会使用面积大于4200平方像素的手,这只剩下621手。 我意识到这可能还不够,如果需要,我会寻找更多图像。 但是,所有图像的注释如下:
我有如下边界框的坐标:
但是,边界框未与x&y轴对齐。
我相信我必须从图像中剪裁出来。 我有两种方法可以做到这一点:
1)令xmin和xmax为边界框的最小和最大x坐标。 而ymin和ymax是边界框的最小和最大y坐标。 如果这样做,我将得到:
(当然,没有边界框),背景的某些部分仍保留在上面。
2)我可以使用二进制遮罩“遮蔽”边界框内的所有像素。如果这样做,我图像的大小仍将是xmin到xmax和ymin到ymax,但是我可以设置其余部分背景为白色。
有什么会更好? 我相信正面应该只包含感兴趣的对象(在这种情况下为手),所以离开背景可能不对吗? 但是,白色背景还可以吗?
这里的主要问题是边界框未对齐!
可以保留少量背景,但每个图像中的背景会有所不同,因此不会作为分类器的一部分创建。
我建议做一个更大的负片来抵消背景,并且620张图像就可以了。
您可能还想看看labelme http://labelme.csail.mit.edu/Release3.0/index.php
我在项目中使用了它,它们还向您展示了如何使用Amazon Turk获取自己的数据集。 我认为您也许也可以使用他们的数据集。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.