通過在卷積神經網絡中使用平均池化理解對分辨率的影響

Question

我在 CIFAR-10 數據集上使用colorization代碼，我遇到了這一行：

downsize_module = nn.Sequential(nn.AvgPool2d(2), nn.AvgPool2d(2),  nn.Upsample(scale_factor=2), .Upsample(scale_factor=2))

平均池化使用了兩次，那么resolution of output image ？

以下是我的理解：

例如，如果我們有8*8原始輸入圖像，第一個平均池 (2*2) 將給出 4*4 作為 output，第二個平均 (2*2) 池將給出 2*2 作為 output。

output 圖像的分辨率以像素為單位為輸入圖像的 1/16。 因此，就像素而言，它將是原始的 1/16，但就尺寸而言，它將是原始的 1/4。

哪個是正確的說法？ 以像素為單位的 1/16 或 1/4。

Answer 1

您在兩種情況下都提供相同的信息，您只需要指定您正在談論的單位。 邊緣中的像素或像素總數。 如果您的圖像是正方形的，則總像素數與邊緣像素數的平方成比例。 通常在提到像素總數時（例如在攝影中），通常會看到類似的內容：分辨率 = 10.4Mp 或 3.2kp。 另一方面，在談論屏幕時，分辨率通常是圖像的高度（以像素為單位），例如：Resolution = 1080 表示 1920x1080 像素的圖像。

通過在卷積神經網絡中使用平均池化理解對分辨率的影響

問題描述

1 個解決方案

解決方案1
1 已采納 2020-06-14 13:30:41

通過在卷積神經網絡中使用平均池化理解對分辨率的影響

問題描述

1 個解決方案

解決方案1 1 已采納 2020-06-14 13:30:41

解決方案1
1 已采納 2020-06-14 13:30:41