python - 为什么更多的时期会使我的模型变得更糟？

酷图

确实，早期的图表似乎很有趣，但请仔细看一下：

我清楚地看到了预期的数据应该达到峰值的巨大预测谷

这真的更好吗？ 听起来像是完全异相的随机波，这意味着直线确实比这更好。

看看“训练损失”，这肯定可以告诉您您的模型是否更好。

如果是这种情况，而您的模型没有达到所需的输出，那么您可能应该制作一个功能更强大的模型（更多的层，更多的单元，不同的方法等）。 但是请注意，无论模型多么出色，许多数据集都是太随机而无法学习。

过度拟合-训练损失变好，但验证损失变差

如果您实际上有更好的训练损失。 好的，所以您的模型确实在变好。

您是否正在绘制训练数据？ -那么这条直线实际上比异相波还好

您是否正在绘制验证数据？

验证损失发生了什么？ 更好或更差？

如果您的“验证”损失越来越严重，则表明您的模型过度拟合。 它是在记忆训练数据，而不是一般地学习。 您需要功能较弱的模型，或大量的“辍学”模型。

通常，在最佳点上，验证损失会停止下降，而训练损失会持续下降。 如果您过度健身，这是停止训练的关键。 在keras文档中阅读有关EarlyStopping回调的信息。

学习率低-培训损失会无限期增加

如果您的培训损失在增加，那么您就遇到了一个真正的问题，要么是错误，要么是使用自定义图层的地方某个计算准备不好，或者仅仅是学习率太大 。

降低学习率（将其除以10或100），创建并编译“新”模型，然后重新开始训练。

为什么实施类权重会使模型变得更糟

[英]Why does implementing class weights make the model worse

Gensim Word2Vec model 通过增加 epoch 数变得更糟

[英]Gensim Word2Vec model getting worse by increasing the number of epochs

为什么我的 Keras model 没有按规定加载所有 5 个时期？

[英]Why my Keras model is not loading through all 5 epochs as specified?

为什么我的张量流模型输出在x epochs之后变为NaN？

[英]Why my tensorflow model outputs become NaN after x epochs?

为什么LSTM模型的损失会在几个时期内上升？

[英]Why does the loss of the LSTM model rise up over several epochs?

我是否应该继续训练我的 model 以获得更好的 R 平方值？

[英]Should I keep training my model for more Epochs to get a better R Squared value?

为什么当我使用更多的 epoch 来训练我的 CNN 时，我的测试准确率会下降

[英]Why my test accuracy falls when i use more epochs for training my CNN

为什么我在multi_gpu_model的Keras中的训练速度比单gpu差？

[英]Why my training speed in Keras with multi_gpu_model is worse than single gpu?

为什么我的神经网络在几个 epoch 之后权重极低？

[英]Why does my neural network have extremely low weights after a few epochs?

当我实施Keras的Fully Convolutional Networks时，为什么我的代码会抛出KeyError：'epochs'

[英]Why does my code throwing KeyError: 'epochs' when I implemented Fully Convolutional Networks by Keras

为什么更多的时期会使我的模型变得更糟？

问题描述

1 个解决方案

解决方案1
3 已采纳 2018-07-16 16:24:43

酷图

过度拟合-训练损失变好，但验证损失变差

学习率低-培训损失会无限期增加

另一个问题？