簡體   English   中英

通過在卷積神經網絡中使用平均池化理解對分辨率的影響

[英]Understanding the effect on resolution by using average pooling in convolution neural network

我在 CIFAR-10 數據集上使用colorization代碼,我遇到了這一行:

downsize_module = nn.Sequential(nn.AvgPool2d(2), nn.AvgPool2d(2),  nn.Upsample(scale_factor=2), .Upsample(scale_factor=2))

平均池化使用了兩次,那么resolution of output image

以下是我的理解:

例如,如果我們有8*8原始輸入圖像,第一個平均池 (2*2) 將給出 4*4 作為 output,第二個平均 (2*2) 池將給出 2*2 作為 output。

output 圖像的分辨率以像素為單位為輸入圖像的 1/16。 因此,就像素而言,它將是原始的 1/16,但就尺寸而言,它將是原始的 1/4。

哪個是正確的說法? 以像素為單位的 1/16 或 1/4。

您在兩種情況下都提供相同的信息,您只需要指定您正在談論的單位。 邊緣中的像素或像素總數。 如果您的圖像是正方形的,則總像素數與邊緣像素數的平方成比例。 通常在提到像素總數時(例如在攝影中),通常會看到類似的內容:分辨率 = 10.4Mp 或 3.2kp。 另一方面,在談論屏幕時,分辨率通常是圖像的高度(以像素為單位),例如:Resolution = 1080 表示 1920x1080 像素的圖像。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM