繁体 English 中英

每次下降之间的困惑度计算都会上升

[英]Perplexity calculations rise between each significantly drop

原文 2017-06-03 12:03:43 0 1 machine-learning/ tensorflow/ training-data/ perplexity

我正在使用LSTM和tensorflow的翻译模型训练会话代理。 我使用分批训练，因此在每个纪元开始之后，训练数据的混乱程度明显下降。 可以用我批量读取数据的方式来解释这一下降，因为我保证训练数据中的每个训练对在每个时期都被完全处理一次。 当一个新纪元开始时，模型在先前纪元中所做的改进将在再次遇到训练数据时显示其利润，表示为图中的下降。 其他批量方法（例如tensorflow转换模型中使用的方法）将不会导致相同的行为，因为它们的方法是将整个训练数据加载到内存中并从中随机选择样本。

步骤，困惑

330000，19.36
340000，19.20
350000，17.79
360000，17.79
370000，17.93
380000，17.98
390000，18.05
400000，18.10
410000，18.14
420000，18.07
430000，16.48
440000，16.75

（从困惑中切出的一小部分显示在350000和430000处出现了下降。在下降之间，困惑度略有上升）

但是，我的问题是关于下降之后的趋势。 从图中可以明显看出，困惑度略有上升（在步骤〜350000之后的每个时期），直到下一个下降为止。 有人可以给出答案或理论来解释为什么会这样吗？

1 个解决方案

这将是过度拟合的典型情况。

如何在Keras中实现困惑？

[英]How to Implement Perplexity in Keras?

如何测量张量流中的困惑度？

[英]How to measure perplexity in tensorflow?

NLTK困惑度测度反演

[英]NLTK Perplexity measure inversion

2.3 Pytorch BCEloss 与我自己的“log”计算之比

[英]2.3 ratio between Pytorch BCEloss and my own “log” calculations

Huggingface gpt2语言model代码哪里计算perplexity？

[英]Where is perplexity calculated in the Huggingface gpt2 language model code?

coreNLP显着减缓了火花工作

[英]coreNLP significantly slowing down spark job`

同一数据集上 MAPE 和 MAE 的值显着不同

[英]Significantly different values for MAPE and MAE on the same dataset

如何显着降低 iOS 应用中的能源影响？

[英]How to significantly reduce Energy Impact in iOS app?

差分隐私显着降低 model 性能

[英]Differential Privacy decreases the model performance significantly

如何提高python中支持向量机的准确性？

[英]How can I rise the accuracy in support vector machine in python?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在Keras中实现困惑？如何测量张量流中的困惑度？ NLTK困惑度测度反演 2.3 Pytorch BCEloss 与我自己的“log”计算之比 Huggingface gpt2语言model代码哪里计算perplexity？ coreNLP显着减缓了火花工作同一数据集上 MAPE 和 MAE 的值显着不同如何显着降低 iOS 应用中的能源影响？差分隐私显着降低 model 性能如何提高python中支持向量机的准确性？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM