tensorflow GradientDescentOptimizer：运算输入和计算的输入梯度之间的形状不兼容

Question

在优化步骤之前，该模型运行良好。 但是，当我要优化模型时，出现错误消息：

运算输入和计算的输入梯度之间的形状不兼容。 转发操作：softmax_cross_entropy_with_logits_sg_12。 输入索引：0。原始输入形状：（16，1）。 计算的输入渐变形状：（16，16）

以下是我的代码。

import tensorflow as tf;  
batch_size = 16
size = 400
labels  = tf.placeholder(tf.int32, batch_size)
doc_encode  = tf.placeholder(tf.float32, [batch_size, size])

W1 = tf.Variable(np.random.rand(size, 100), dtype=tf.float32, name='W1')
b1 = tf.Variable(np.zeros((100)), dtype=tf.float32, name='b1')

W2 = tf.Variable(np.random.rand(100, 1),dtype=tf.float32, name='W2')
b2 = tf.Variable(np.zeros((1)), dtype=tf.float32, name='b2')

D1 = tf.nn.relu(tf.matmul(doc_encode, W1) + b1)
D2 = tf.nn.selu(tf.matmul(D1, W2) + b2)

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=labels, logits=D2))
optim = tf.train.GradientDescentOptimizer(0.01).minimize(cost, aggregation_method=tf.AggregationMethod.EXPERIMENTAL_TREE)
with tf.Session() as sess:  
    sess.run(tf.global_variables_initializer())
    _cost, _optim = sess.run([cost, optim], {labels:np.array([1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1]), doc_encode: np.random.rand(batch_size, size)})

Answer 1

更正以下内容。

第一，

将占位符输入形状更改为此

X = tf.placeholder(tf.int32, shape=[None,400]
Y = tf.placeholder(tf.float32, shape=[None,1]

为什么选择“ 无”，因为这使您可以自由喂食任何尺寸的食物。 这是首选方法，因为在训练时要使用微型批处理，而在预测或推断时间时，通常将只喂一些东西。 将其标记为None（无），即可解决。

第二，

校正体重初始化，您输入的是随机值，它们也可能是负数。 始终建议使用较小的正值进行初始化。 （我看到您正在使用relu作为激活，对于负权重值，其Gradient为零，因此这些权重永远不会在Gradient下降中更新，换句话说，这些都是无用的权重）

第三，

Logits是从W2*x + b2获得的结果。 且该tf.nn.softmax_cross.....(..)自动应用了softmax激活。 因此，最后一层不需要SeLu。

tensorflow GradientDescentOptimizer：运算输入和计算的输入梯度之间的形状不兼容

问题描述

1 个解决方案

解决方案1
1 已采纳 2018-05-24 05:08:19

tensorflow GradientDescentOptimizer：运算输入和计算的输入梯度之间的形状不兼容

问题描述

1 个解决方案

解决方案1 1 已采纳 2018-05-24 05:08:19

解决方案1
1 已采纳 2018-05-24 05:08:19