繁体 English 中英

最小批量交叉熵的平均值以优化张量流

[英]Mean of minibatch cross-entropy to optimize in tensorflow

原文 2018-03-14 07:05:45 9 2 python/ tensorflow

我试图遵循Martin Gorner关于使用TensorFlow的演讲以及官方TensorFlow文档中的教程。

我很困惑，为什么在Gorner的演讲中，他在标签和预测之间使用点积的负和。 但是在TensorFlow教程中，它使用相同的方法，然后将其除以获取每个小批量的平均值。

基本上，只要您提高学习率，两种方法都可以使用，但是我不了解方法不同的原因。

2 个解决方案

使用平均值而不是总和，使目标函数的大小对于最小批量大小的选择不变。 因此，当您决定更改小批量的大小时，您可以期望与以前相同的学习率仍然可以正常工作。

对于其他超参数（例如L2正则化因子）也是如此。

它的规模很大，似乎均值可以控制非常不同的变量。 使用总和时，无法保证变量的谐波标度。 但是用mean ，您可以确定没有very different 。

如何在 TensorFlow 中选择交叉熵损失？

[英]How to choose cross-entropy loss in TensorFlow?

交叉熵Keras中的自定义参数

[英]Custom parameters in cross-entropy Keras

向量化softmax交叉熵梯度

[英]Vectorizing softmax cross-entropy gradient

交叉熵损失及其梯度的实现

[英]Implementation of cross-entropy loss and its gradient

如何手动计算分类交叉熵？

[英]How to calculate Categorical Cross-Entropy by hand?

在损失函数中结合交叉熵和 mse

[英]Combine cross-entropy and mse in loss function

在 TensorFlow 中计算交叉熵

[英]Calculating Cross Entropy in TensorFlow

PyTorch 的交叉熵损失是如何以及在哪里实现的？

[英]How and where is PyTorch's cross-entropy loss implemented?

我的交叉熵函数实现有什么问题？

[英]What is the problem with my implementation of the cross-entropy function?

神经网络未经训练，交叉熵保持不变

[英]Neural network is not being trained, cross-entropy stays about the same

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在 TensorFlow 中选择交叉熵损失？交叉熵Keras中的自定义参数向量化softmax交叉熵梯度交叉熵损失及其梯度的实现如何手动计算分类交叉熵？在损失函数中结合交叉熵和 mse 在 TensorFlow 中计算交叉熵 PyTorch 的交叉熵损失是如何以及在哪里实现的？我的交叉熵函数实现有什么问题？神经网络未经训练，交叉熵保持不变

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM