簡體 English 中英

利用L2正則化優化稀疏softmax交叉熵

[英]Optimize sparse softmax cross entropy with L2 regularization

原文 2018-06-20 16:32:31 9 1 python/ tensorflow/ neural-network/ loss-function

我正在使用tf.losses.sparse_softmax_cross_entropy作為最后一層的分類函數來訓練我的網絡，並且一切工作正常。

我現在只是在權重上添加了L2正則化，並且損失不再得到優化。 會發生什么事？

reg = tf.nn.l2_loss(w1) + tf.nn.l2_loss(w2)
loss = tf.reduce_mean(tf.losses.sparse_softmax_cross_entropy(y, logits)) + reg*beta
train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

1 個解決方案

給定提供的信息，很難確定答案，但這是可能的原因：

tf.nn.l2_loss計算為元素上的總和，而交叉熵損失減少到其均值（cf tf.reduce_mean ），因此這兩個項之間存在數值不平衡。

例如，嘗試將每個L2損耗除以計算tf.size(w1)的元素數量（例如tf.size(w1) ）。

Tensorflow：具有交叉熵損失的加權稀疏softmax

[英]Tensorflow: Weighted sparse softmax with cross entropy loss

sparse_softmax_cross_entropy_with_logits結果比softmax_cross_entropy_with_logits差

[英]sparse_softmax_cross_entropy_with_logits results is worse than softmax_cross_entropy_with_logits

tf.nn.sparse_softmax_cross_entropy_with_logits錯誤

[英]Error with tf.nn.sparse_softmax_cross_entropy_with_logits

tf.nn.sparse_softmax_cross_entropy_with_logits的意外輸出

[英]Unexpected output for tf.nn.sparse_softmax_cross_entropy_with_logits

來自Tensorflow中的sparse_softmax_cross_entropy_with_logits的NaN

[英]NaN from sparse_softmax_cross_entropy_with_logits in Tensorflow

愛德華的權重的L2正則化

[英]L2 regularization of weights in Edward

如何使用sparse_softmax_cross_entropy_with_logits在tensorflow中實現加權交叉熵損失

[英]How can I implement a weighted cross entropy loss in tensorflow using sparse_softmax_cross_entropy_with_logits

計算 L1 和 L2 正則化的損失

[英]Compute the Loss of L1 and L2 regularization

PyTorch 中的 L1/L2 正則化

[英]L1/L2 regularization in PyTorch

Keras L2正則化使網絡不學習

[英]Keras L2 regularization makes the network not learn

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Tensorflow：具有交叉熵損失的加權稀疏softmax sparse_softmax_cross_entropy_with_logits結果比softmax_cross_entropy_with_logits差 tf.nn.sparse_softmax_cross_entropy_with_logits錯誤 tf.nn.sparse_softmax_cross_entropy_with_logits的意外輸出來自Tensorflow中的sparse_softmax_cross_entropy_with_logits的NaN 愛德華的權重的L2正則化如何使用sparse_softmax_cross_entropy_with_logits在tensorflow中實現加權交叉熵損失計算 L1 和 L2 正則化的損失 PyTorch 中的 L1/L2 正則化 Keras L2正則化使網絡不學習

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM