繁体 English 中英

Kernel 3D 卷积的大小

[英]Kernel Size for 3D Convolution

原文 2022-01-24 22:41:56 6 1 deep-learning/ neural-network/ pytorch/ conv-neural-network

3D 卷积的 kernel 大小是使用 Pytorch 或 Z074DD699710DA0EC1EB345F13B317 中的深度、高度和宽度定义的。 例如，如果我们考虑具有 300 个切片的 CT/MRI 图像数据，输入张量可以是 (1,1,300,128,128)，对应于 (N,C,D,H,W)。 然后，kernel 的深度、高度和宽度可以是 (3,3,3)。 在做3D卷积时，kernel在3个方向上传递。

但是，如果我们将情况从 CT/MRI 更改为彩色视频，我会感到困惑。 让视频有 300 帧，那么输入张量将是 (1,3,300,128,128)，因为 RGB 图像有 3 个通道。 我知道对于单个 RGB 图像，通道、高度和宽度的 kernel 大小可以是 3X3X3。 但是对于视频，Pytorch 和 Tensorflow 似乎仍然使用深度、高度和宽度来设置 kernel 大小。 我的问题是，如果我们仍然使用 (3,3,3) 的 kernel，颜色通道是否存在潜在的第四维？

1 个解决方案

是的。

实际上，CNN 中发生的卷积操作比其同名的要高一维。 通道尺寸总是由整个 kernel 跨越，因此没有沿通道尺寸滑动。 例如，将 kernel 大小设置为 5x5 的 2D 卷积层应用于 3 通道输入，实际上是使用形状为 3x5x5 的 kernel（假设通道优先表示法）。 每个 output 通道是输入与不同的 3x5x5 kernel 卷积的结果，因此每个 Z78E6221F6393D1356681DB393D2Z 通道都有这些 3x5x5 内核之一。

视频也是如此。 一个 3D 卷积层实际上是以相同的方式执行 4D 卷积。 因此，形状为 1x3x300x128x128 且 kernel 大小设置为 3x3x3 的输入实际上将使用形状为 3x3x3x3 的内核执行 4D 卷积。

核大小应该与一维卷积中的字大小相同吗？

[英]Should Kernel size be same as word size in 1D Convolution?

为什么不能在一维卷积中设置内核大小？

[英]why I can't set kernel size in 1d convolution?

非平方卷积核大小

[英]Non-squared convolution kernel size

理解2D卷积output大小

[英]Understanding 2D convolution output size

具有共享内存的cuda平铺3d卷积实现

[英]cuda tiled 3d convolution implementations with shared memory

Deepmind Deep Q网络（DQN）3D卷积

[英]Deepmind Deep Q Network (DQN) 3D Convolution

我需要一些关于张量流中分离 3D 卷积的帮助

[英]I need some help about separated 3D convolution in tensorflow

为什么 PyTorch DQN 教程中的 CNN 卷积输出大小是用 `kernel_size -1` 计算的？

[英]Why is CNN convolution output size in PyTorch DQN tutorial computed with `kernel_size -1`?

3D 体积图像沿三个正交（轴）的二维卷积

[英]2D convolution along three orthogonals (axis) for 3D volumetric image

在theano 0.9中对gpu使用3D卷积时的高CPU利用率

[英]High cpu utilization while using 3D convolution on gpu in theano 0.9

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 核大小应该与一维卷积中的字大小相同吗？为什么不能在一维卷积中设置内核大小？非平方卷积核大小理解2D卷积output大小具有共享内存的cuda平铺3d卷积实现 Deepmind Deep Q网络（DQN）3D卷积我需要一些关于张量流中分离 3D 卷积的帮助为什么 PyTorch DQN 教程中的 CNN 卷积输出大小是用 `kernel_size -1` 计算的？ 3D 体积图像沿三个正交（轴）的二维卷积在theano 0.9中对gpu使用3D卷积时的高CPU利用率

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM