簡體 English 中英

每次下降之間的困惑度計算都會上升

[英]Perplexity calculations rise between each significantly drop

原文 2017-06-03 12:03:43 1 1 machine-learning/ tensorflow/ training-data/ perplexity

我正在使用LSTM和tensorflow的翻譯模型訓練會話代理。 我使用分批訓練，因此在每個紀元開始之后，訓練數據的混亂程度明顯下降。 可以用我批量讀取數據的方式來解釋這一下降，因為我保證訓練數據中的每個訓練對在每個時期都被完全處理一次。 當一個新紀元開始時，模型在先前紀元中所做的改進將在再次遇到訓練數據時顯示其利潤，表示為圖中的下降。 其他批量方法（例如tensorflow轉換模型中使用的方法）將不會導致相同的行為，因為它們的方法是將整個訓練數據加載到內存中並從中隨機選擇樣本。

步驟，困惑

330000，19.36
340000，19.20
350000，17.79
360000，17.79
370000，17.93
380000，17.98
390000，18.05
400000，18.10
410000，18.14
420000，18.07
430000，16.48
440000，16.75

（從困惑中切出的一小部分顯示在350000和430000處出現了下降。在下降之間，困惑度略有上升）

但是，我的問題是關於下降之后的趨勢。 從圖中可以明顯看出，困惑度略有上升（在步驟〜350000之后的每個時期），直到下一個下降為止。 有人可以給出答案或理論來解釋為什么會這樣嗎？

1 個解決方案

這將是過度擬合的典型情況。

如何在Keras中實現困惑？

[英]How to Implement Perplexity in Keras?

如何測量張量流中的困惑度？

[英]How to measure perplexity in tensorflow?

NLTK困惑度測度反演

[英]NLTK Perplexity measure inversion

2.3 Pytorch BCEloss 與我自己的“log”計算之比

[英]2.3 ratio between Pytorch BCEloss and my own “log” calculations

Huggingface gpt2語言model代碼哪里計算perplexity？

[英]Where is perplexity calculated in the Huggingface gpt2 language model code?

coreNLP顯着減緩了火花工作

[英]coreNLP significantly slowing down spark job`

同一數據集上 MAPE 和 MAE 的值顯着不同

[英]Significantly different values for MAPE and MAE on the same dataset

如何顯着降低 iOS 應用中的能源影響？

[英]How to significantly reduce Energy Impact in iOS app?

差分隱私顯着降低 model 性能

[英]Differential Privacy decreases the model performance significantly

如何提高python中支持向量機的准確性？

[英]How can I rise the accuracy in support vector machine in python?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在Keras中實現困惑？如何測量張量流中的困惑度？ NLTK困惑度測度反演 2.3 Pytorch BCEloss 與我自己的“log”計算之比 Huggingface gpt2語言model代碼哪里計算perplexity？ coreNLP顯着減緩了火花工作同一數據集上 MAPE 和 MAE 的值顯着不同如何顯着降低 iOS 應用中的能源影響？差分隱私顯着降低 model 性能如何提高python中支持向量機的准確性？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM