簡體 English 中英

訓練損失在前幾個時期減少，但突然上升到很高的值

[英]training loss decrease at first several epochs but jump to a high value suddenly

原文 2019-03-14 20:52:27 3 2 python/ tensorflow/ unity3d-unet

我正在醫學數據集上訓練3D Unet。 我試圖在只有一個實例的小型數據集上過度擬合模型。 損耗首先減小，但突然上升到很高的值。 我附上下面的損耗曲線。 我在每個卷積層和l2正則化之后添加批處理歸一化。
損失函數是加權的softmax交叉熵。
優化器為Adam，初始學習率為0.0001。
我想知道為什么損失無法穩定。 這是否意味着損失函數過於平滑？

2 個解決方案

我改變了初始化體重的方式。 目前，培訓過程非常穩定。 該模型正在按預期收斂。

有很多因素會影響損失函數。 如前所述，您更改了初始化權重的方式。 其他因素可能是學習率，正則化因素，您使用的優化程序的類型。 盡管您已經提到了其中一些。

有一些建議：1.嘗試使用輟學。 2.嘗試使用學習率和正則化的不同組合並標出損失。

另外，我認為使用Adam優化器是一個好主意。 它確實提高了處理速度。

歸根結底，大部分結果都是根據經驗得出的，並且很大程度上取決於您的數據集。

訓練損失隨時期增加而不是減少

[英]Training loss increases instead of decrease with epochs

訓練損失不減少

[英]Training loss does not decrease

訓練損失減少但准確率始終為 0？

[英]Training loss decrease but accuracy is always 0?

損失值不降低

[英]The loss value does not decrease

簡單的Pytorch示例-訓練損失不會減少

[英]Simple Pytorch Example - Loss on training doesnt decrease

訓練和驗證損失減少但准確性波動？

[英]Training and validation loss decrease but accuracy fluctuates?

是什么導致訓練准確率和 epoch 之間的損失大幅躍升？

[英]What is causing large jumps in training accuracy and loss between epochs?

為什么LSTM模型的損失會在幾個時期內上升？

[英]Why does the loss of the LSTM model rise up over several epochs?

為什么CNN的損失會長時間減少然后突然增加？

[英]Why does the loss of a CNN decrease for a long time and then suddenly increase?

驗證損失不斷減少，而訓練損失在 3 個 epoch 后開始增加

[英]Validation loss is keep decreasing while training loss starts to increase after 3 epochs

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 訓練損失隨時期增加而不是減少訓練損失不減少訓練損失減少但准確率始終為 0？損失值不降低簡單的Pytorch示例-訓練損失不會減少訓練和驗證損失減少但准確性波動？是什么導致訓練准確率和 epoch 之間的損失大幅躍升？為什么LSTM模型的損失會在幾個時期內上升？為什么CNN的損失會長時間減少然后突然增加？驗證損失不斷減少，而訓練損失在 3 個 epoch 后開始增加

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM