繁体 English 中英

张量运算的导数

[英]Derivative of a tensor operation

原文 2019-07-11 17:12:15 2 2 python/ machine-learning/ deep-learning

我正在阅读一本关于深度学习的书，我对作者提到的一个想法有点困惑。

我不明白为什么我们从权重中减去 -step * gradient (f) (W0) 而不仅仅是 -step，因为 -step * gradient (f) (W0) 表示损失，而 -step 是参数（即x 值，即重量变化很小）

您需要少量更改与其梯度相反的参数，以确保损失下降。 仅使用step并不能保证损失减少。 这在优化中称为梯度下降，并且有收敛证明。 您可以检查有关这个主题的在线教程，例如这个。

梯度告诉您移动的方向和步长将有助于控制您移动的幅度，以便您的序列收敛。

我们不能只减去step 。 回想一下， step只是一个标量。 W0是张量。 我们不能用标量数减去张量。 梯度是一个与W0大小相同的张量，这将使减法得到很好的定义。

关于梯度下降的阅读可能有助于你的理解。

Tensorflow“地图操作”为张量？

[英]Tensorflow “map operation” for tensor?

[英]Logical operation on the contents of a tensor

[英]Tensor Operation in Tensorflow

[英]How to speed up numpy tensor*tensor operation

[英]Can not convert a function into a tensor or operation

[英]How to improve conditional tensor operation

[英]3D tensor subsetting operation

[英]Vectorize Pytorch Tensor Indexing Operation

[英]Speeding up a pytorch tensor operation

[英]PyTorch: Dynamic Programming as Tensor Operation

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Tensorflow“地图操作”为张量？张量内容的逻辑运算 Tensorflow 中的张量操作如何加速numpy张量*张量操作无法将函数转换为张量或操作如何改善条件张量操作 3D张量子集运算向量化 Pytorch 张量索引操作加速 pytorch 张量运算 PyTorch：作为张量运算的动态规划

相关标签