![](/img/trans.png)
[英]default tf.gradients in TensorFlow - total or partial derivatives?
[英]Tensorflow, tf.gradients calculations
我正在学习如何使用Tensorflow,在这一点上,我真的很困惑并且无法理解它。 想象我有一个5层网络,输出由output
表示。 现在假设我想找到相对于layer_2
的output
渐变。 为此,我将在Tensorflow中编写的代码将类似于:
gradients_i_want = tf.gradients(output, layer_2)
从理论上讲,该梯度应通过链式法则计算。 我想问的是,Tensorflow是否通过链式规则计算这些梯度,还是只取相对于layer_2
的output
导数
Tensorflow将为您的模型创建一个图形,其中每个节点都是一个操作(例如,加法,乘法或它们的组合)。 基本操作具有手动定义的渐变函数,并且在向后浏览图形时应用链式规则时将使用这些函数。
如果您编写自己的自定义操作,则可能还需要编写相应的渐变函数。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.