繁体   English   中英

具有不同输入形状的神经网络

[英]Neural Network with different input shapes

我目前正在设计用于灰度图像着色的神经网络架构。 稍后它应该能够着色具有不同尺寸和不同宽高比的图像。 我读到这对于普通的CNN是不可能的。 我还读到,唯一的选择是将图像缩小到一个特定大小或使用大的固定大小(如3000x3000px)并将剩余空间填充为黑色。 这两个选项似乎都不那么优雅。 第一个与我想要的相反,第二个会使神经网络变慢。

然后我读到有关完全卷积网络的问题,并且那里不存在这个问题。 如果确实有效,这将是很好的。 我想知道为什么这个特殊网络可以处理不同的输入形状。 也许你可以给我看一些这样一个网络的张量流代码。

顺便说一下,我想到了一个自动编码器和一个用于架构的GAN。

根据我的经验,您无法在同一批次上训练任何具有不同样本大小的网络。

完全卷积网络类似于完全连接的网络,最终具有完全连接的层。 因此,批次中的任何输入图像必须具有相同的调光(w,h,d)。

不同之处在于,完全连接的层为输入批次中的每个样本输出单个输出向量,而完全卷积网络输出每个类的概率图。

它具有比图像大小更深的含义,当试图拟合任何数据时,它的大小必须是绝对的,并且在训练时不能改变。 我想你可以按照我说的不同批次进行,但我从未尝试过。

编码器\\解码器可以帮助“重建”特定大小的图像。

这个提示再次来自我在物体检测方面的经验,我可能是错的:)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM