[英]How to implement Region of Interest Pooling layer in tensorflow?
我正在尝试创建Faster RCNN like model。 从功能图上进行ROI合并时,我陷入了困境。 我知道这里可以使用双线性采样,但是对于端到端训练可能没有帮助。 如何在张量流中实现此ROI池化层?
顾名思义,双线性采样实际上可以用于端到端训练,因为它基本上是线性运算。 但是,缺点是您的局部最大值(即强激发或某些单位)可能会消失,因为您的采样点恰好接近最小值。 为了解决这个问题,您可以改用max_pool(features, kernel, stride)
操作,其中调整内核和步幅,以便此max pool操作的最终输出始终具有相同的尺寸。
例如:您的12x12
尺寸为12x12
并且您希望将其12x12
为4x4
,然后设置kernel=(3,3)
和stride=(3,3)
可以帮助您实现这一目标,对于每个3x3
补丁,相应的特征图将包含在输出中。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.