繁体   English   中英

Conv3d 与 Conv2d 之间的区别

[英]Difference between Conv3d vs Conv2d

我对 conv2d 和 conv3d 函数之间的区别有点困惑。 例如,如果我有一堆 N 个图像,H 高和 W 宽,以及 3 个 RGB 通道。 网络的输入可以是两种形式 form1: (batch_size, N, H, W, 3) 这是一个 5 阶张量形式 2: (batch_size, H, W, 3N ) 这是一个 4 阶张量

问题是,如果我将 conv3d 与大小为 (N,3,3) 的 M 个过滤器应用于 form1 并将 conv2d 与大小为 (3,3) 的 M 个过滤器应用于

它们是否具有基本相同的功能操作? 我认为这两种形式都在时间和空间维度上进行了卷积。

如果有人能帮我解决这个问题,我真的很感激。

如果你有一堆图像,你就有了一个视频。 你不能有两个输入表单。 您有图片或视频。 对于视频案例,您可以使用 3D 卷积,但未为其定义 2D 卷积。 如果您按照您提到的方式堆叠通道(3N),2D 卷积会将堆栈解释为具有许多通道的一张图像,而不是堆栈。

请注意,带有 (batch, H, W, Channels) 的 2D 卷积与带有 (batch, H, W, Channels, 1) 的 3D 卷积相同。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM