[英]Output Dimensions of convolution in PyTorch
我的输入图像的大小是 68 x 224 x 3 (HxWxC),第一个Conv2d
层定义为
conv1 = torch.nn.Conv2d(3, 16, stride=4, kernel_size=(9,9))
。
为什么 output 特征体积的尺寸是 16 x 15 x 54? 我知道有 16 个过滤器,所以前面有 16 个,但是如果我使用[(W−K+2P)/S]+1
来计算维度,则维度不可整除。
有人可以解释一下吗?
特征图的计算是[(W−K+2P)/S]+1
,这里[]
括号表示楼层划分。 在您的示例中,填充zero
,因此计算为[(68-9+2*0)/4]+1 ->[14.75]=14 -> [14.75]+1 = 15
和[(224-9+2*0)/4]+1 -> [53.75]=53 -> [53.75]+1 = 54
。
import torch
conv1 = torch.nn.Conv2d(3, 16, stride=4, kernel_size=(9,9))
input = torch.rand(1, 3, 68, 224)
print(conv1(input).shape)
# torch.Size([1, 16, 15, 54])
您也可能会看到不同的公式来计算特征图。
一般来说,您可能会看到:
但是两种情况的结果是一样的
在卷积层之后估计张量的 output 大小时遇到了同样的不便。 查看我在https://github.com/tuttelikz/conv_output_size实现的帮助程序 function。
例子:
import torch
import torch.nn as nn
from conv_output_size import conv2d_output_size
c_i, c_o = 3, 16
k, s, p = 3, 2, 1
sample_2d_tensor = torch.ones((c_i, 64, 64))
c2d = nn.Conv2d(in_channels=c_i, out_channels=c_o, kernel_size=k,
stride=s, padding=p)
output_size = conv2d_output_size(
sample_2d_tensor.shape, out_channels=c_o, kernel_size=k, stride=s, padding=p)
print("After conv2d")
print("Dummy input size:", sample_2d_tensor.shape)
print("Calculated output size:", output_size)
print("Real output size:", c2d(sample_2d_tensor).detach().numpy().shape")
>>> After conv2d
>>> Dummy input size: torch.Size([3, 64, 64])
>>> Calculated output size: (16, 32, 32)
>>> Real output size: (16, 32, 32)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.