Keras梯度WRT输入可用于多个输出尺寸

Question

我有一个带有二维输出（二进制分类）的keras模型。

model.output # <tf.Tensor 'dense_1_3/MatMul:0' shape=(?, 2) dtype=float32>

和

model.input # <tf.Tensor 'bidirectional_1_input:0' shape=(?, ?, 200) dtype=float32>

我为形状的一些示例输入（1,50,200）评估了三种不同的渐变

gradients0 = K.gradients(model.output[:,0] model.inputs)
gradients1 = K.gradients(model.output[:,1], model.inputs)
gradients2 = K.gradients(model.output, model.inputs)

我以为，前两个表达式产生单个输出神经元的梯度，而后一个表达式产生包含前两个表达式的张量。 令我惊讶的是，所有三个渐变的形状均为(1,50,200) 。 在我看来，由于model.output是二维的，所以gradients2的形状必须为(2,50,200) 。 在这种情况下，keras计算是什么？

Answer 1

Keras.backend.gradients（）期望输出是标量函数，而不是多维函数。 我通过一个小示例发现K.gradients（）的执行效果与tf.gradients（）相同。 这样（如此处所示： https : //www.tensorflow.org/api_docs/python/tf/gradients ），您的gradients2返回长度为len（xs）的张量的列表，其中每个张量都是sum（dy / dx ）表示ys中的y ，这说明了为什么第一个形状尺寸是1而不是2。

该链接可以为您提供帮助：关于矩阵的Tensorflow梯度

Keras梯度WRT输入可用于多个输出尺寸

问题描述

1 个解决方案

解决方案1
2 已采纳 2019-01-15 14:52:59

Keras梯度WRT输入可用于多个输出尺寸

问题描述

1 个解决方案

解决方案1 2 已采纳 2019-01-15 14:52:59

解决方案1
2 已采纳 2019-01-15 14:52:59