Tensorflow中的Conv1D混乱

Question

由于存在尺寸问题，试图实施纸张并碰到一些砖墙。 我的输入是单声道音频数据，其中128帧50ms的16kHz采样音频被馈送到网络中。 所以我的输入形状是：[128,0.005 * 16000，1]这是图层详细信息-

1.）conv-bank块：Conv1d-bank-8，LeReLU，IN（实例规范化）我使用以下方法实现此目的：

bank_width = 8
conv_bank_outputs = tf.concat([ tf.layers.conv1d(input,1,k,activation=tf.nn.leaky_relu,padding="same") for k in range(1, bank_width + 1)], axes = -1)

2.）conv-block：C-512-5，LReLu-> C-512-5，stride = 2，LReLu，IN，RES（剩余）

这是我卡住的地方，第二次卷积的输出和（2）层的输入的形状不匹配。 我无法解决这个问题。

我使用以下方法实现此目的：

block_1 = tf.layers.conv1d(input,filters=512,kernel_size=5,activation=tf.nn.leaky_relu,padding="same")
block_2 = tf.layers.conv1d(block_1,filters=512,kernel_size=5,strides=2,activation=tf.nn.leaky_relu,padding="same")
IN = tf.contrib.layers.instance_norm(block_2)
RES = IN + input

错误： ValueError: Dimensions must be equal, but are 400 and 800 for 'add' (op: 'Add') with input shapes: [128,400,512], [128,800,1024].

Answer 1

当您在具有stride = 2的block1上运行conv1d时，输入数据将减半，因为conv1d仅有效地采样了备用数字，并且您更改了通道数。 这通常可以通过使用跨步2和过滤器512通过1x1 conv对输入进行下采样来解决，尽管如果可以共享纸张，我可以更具体一些。

Tensorflow中的Conv1D混乱

问题描述

1 个解决方案

解决方案1
0 2018-07-04 20:34:26

Tensorflow中的Conv1D混乱

问题描述

1 个解决方案

解决方案1 0 2018-07-04 20:34:26

解决方案1
0 2018-07-04 20:34:26