[英]How to implement Region of Interest Pooling layer in tensorflow?
我正在嘗試創建Faster RCNN like model。 從功能圖上進行ROI合並時,我陷入了困境。 我知道這里可以使用雙線性采樣,但是對於端到端訓練可能沒有幫助。 如何在張量流中實現此ROI池化層?
顧名思義,雙線性采樣實際上可以用於端到端訓練,因為它基本上是線性運算。 但是,缺點是您的局部最大值(即強激發或某些單位)可能會消失,因為您的采樣點恰好接近最小值。 為了解決這個問題,您可以改用max_pool(features, kernel, stride)
操作,其中調整內核和步幅,以便此max pool操作的最終輸出始終具有相同的尺寸。
例如:您的12x12
尺寸為12x12
並且您希望將其12x12
為4x4
,然后設置kernel=(3,3)
和stride=(3,3)
可以幫助您實現這一目標,對於每個3x3
補丁,相應的特征圖將包含在輸出中。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.