python - 為什么更多的時期會使我的模型變得更糟？

酷圖

確實，早期的圖表似乎很有趣，但請仔細看一下：

我清楚地看到了預期的數據應該達到峰值的巨大預測谷

這真的更好嗎？ 聽起來像是完全異相的隨機波，這意味着直線確實比這更好。

看看“訓練損失”，這肯定可以告訴您您的模型是否更好。

如果是這種情況，而您的模型沒有達到所需的輸出，那么您可能應該制作一個功能更強大的模型（更多的層，更多的單元，不同的方法等）。 但是請注意，無論模型多么出色，許多數據集都是太隨機而無法學習。

過度擬合-訓練損失變好，但驗證損失變差

如果您實際上有更好的訓練損失。 好的，所以您的模型確實在變好。

您是否正在繪制訓練數據？ -那么這條直線實際上比異相波還好

您是否正在繪制驗證數據？

驗證損失發生了什么？ 更好或更差？

如果您的“驗證”損失越來越嚴重，則表明您的模型過度擬合。 它是在記憶訓練數據，而不是一般地學習。 您需要功能較弱的模型，或大量的“輟學”模型。

通常，在最佳點上，驗證損失會停止下降，而訓練損失會持續下降。 如果您過度健身，這是停止訓練的關鍵。 在keras文檔中閱讀有關EarlyStopping回調的信息。

學習率低-培訓損失會無限期增加

如果您的培訓損失在增加，那么您就遇到了一個真正的問題，要么是錯誤，要么是使用自定義圖層的地方某個計算准備不好，或者僅僅是學習率太大 。

降低學習率（將其除以10或100），創建並編譯“新”模型，然后重新開始訓練。

為什么實施類權重會使模型變得更糟

[英]Why does implementing class weights make the model worse

Gensim Word2Vec model 通過增加 epoch 數變得更糟

[英]Gensim Word2Vec model getting worse by increasing the number of epochs

為什么我的 Keras model 沒有按規定加載所有 5 個時期？

[英]Why my Keras model is not loading through all 5 epochs as specified?

為什么我的張量流模型輸出在x epochs之后變為NaN？

[英]Why my tensorflow model outputs become NaN after x epochs?

為什么LSTM模型的損失會在幾個時期內上升？

[英]Why does the loss of the LSTM model rise up over several epochs?

我是否應該繼續訓練我的 model 以獲得更好的 R 平方值？

[英]Should I keep training my model for more Epochs to get a better R Squared value?

為什么當我使用更多的 epoch 來訓練我的 CNN 時，我的測試准確率會下降

[英]Why my test accuracy falls when i use more epochs for training my CNN

為什么我在multi_gpu_model的Keras中的訓練速度比單gpu差？

[英]Why my training speed in Keras with multi_gpu_model is worse than single gpu?

為什么我的神經網絡在幾個 epoch 之后權重極低？

[英]Why does my neural network have extremely low weights after a few epochs?

當我實施Keras的Fully Convolutional Networks時，為什么我的代碼會拋出KeyError：'epochs'

[英]Why does my code throwing KeyError: 'epochs' when I implemented Fully Convolutional Networks by Keras

為什么更多的時期會使我的模型變得更糟？

問題描述

1 個解決方案

解決方案1
3 已采納 2018-07-16 16:24:43

酷圖

過度擬合-訓練損失變好，但驗證損失變差

學習率低-培訓損失會無限期增加

另一個問題？