簡體 English 中英

Kernel 3D 卷積的大小

[英]Kernel Size for 3D Convolution

原文 2022-01-24 22:41:56 7 1 deep-learning/ neural-network/ pytorch/ conv-neural-network

3D 卷積的 kernel 大小是使用 Pytorch 或 Z074DD699710DA0EC1EB345F13B317 中的深度、高度和寬度定義的。 例如，如果我們考慮具有 300 個切片的 CT/MRI 圖像數據，輸入張量可以是 (1,1,300,128,128)，對應於 (N,C,D,H,W)。 然后，kernel 的深度、高度和寬度可以是 (3,3,3)。 在做3D卷積時，kernel在3個方向上傳遞。

但是，如果我們將情況從 CT/MRI 更改為彩色視頻，我會感到困惑。 讓視頻有 300 幀，那么輸入張量將是 (1,3,300,128,128)，因為 RGB 圖像有 3 個通道。 我知道對於單個 RGB 圖像，通道、高度和寬度的 kernel 大小可以是 3X3X3。 但是對於視頻，Pytorch 和 Tensorflow 似乎仍然使用深度、高度和寬度來設置 kernel 大小。 我的問題是，如果我們仍然使用 (3,3,3) 的 kernel，顏色通道是否存在潛在的第四維？

1 個解決方案

是的。

實際上，CNN 中發生的卷積操作比其同名的要高一維。 通道尺寸總是由整個 kernel 跨越，因此沒有沿通道尺寸滑動。 例如，將 kernel 大小設置為 5x5 的 2D 卷積層應用於 3 通道輸入，實際上是使用形狀為 3x5x5 的 kernel（假設通道優先表示法）。 每個 output 通道是輸入與不同的 3x5x5 kernel 卷積的結果，因此每個 Z78E6221F6393D1356681DB393D2Z 通道都有這些 3x5x5 內核之一。

視頻也是如此。 一個 3D 卷積層實際上是以相同的方式執行 4D 卷積。 因此，形狀為 1x3x300x128x128 且 kernel 大小設置為 3x3x3 的輸入實際上將使用形狀為 3x3x3x3 的內核執行 4D 卷積。

核大小應該與一維卷積中的字大小相同嗎？

[英]Should Kernel size be same as word size in 1D Convolution?

為什么不能在一維卷積中設置內核大小？

[英]why I can't set kernel size in 1d convolution?

非平方卷積核大小

[英]Non-squared convolution kernel size

理解2D卷積output大小

[英]Understanding 2D convolution output size

具有共享內存的cuda平鋪3d卷積實現

[英]cuda tiled 3d convolution implementations with shared memory

Deepmind Deep Q網絡（DQN）3D卷積

[英]Deepmind Deep Q Network (DQN) 3D Convolution

我需要一些關於張量流中分離 3D 卷積的幫助

[英]I need some help about separated 3D convolution in tensorflow

為什么 PyTorch DQN 教程中的 CNN 卷積輸出大小是用 `kernel_size -1` 計算的？

[英]Why is CNN convolution output size in PyTorch DQN tutorial computed with `kernel_size -1`?

3D 體積圖像沿三個正交（軸）的二維卷積

[英]2D convolution along three orthogonals (axis) for 3D volumetric image

在theano 0.9中對gpu使用3D卷積時的高CPU利用率

[英]High cpu utilization while using 3D convolution on gpu in theano 0.9

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 核大小應該與一維卷積中的字大小相同嗎？為什么不能在一維卷積中設置內核大小？非平方卷積核大小理解2D卷積output大小具有共享內存的cuda平鋪3d卷積實現 Deepmind Deep Q網絡（DQN）3D卷積我需要一些關於張量流中分離 3D 卷積的幫助為什么 PyTorch DQN 教程中的 CNN 卷積輸出大小是用 `kernel_size -1` 計算的？ 3D 體積圖像沿三個正交（軸）的二維卷積在theano 0.9中對gpu使用3D卷積時的高CPU利用率

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM