簡體 English 中英

Q-learning中的學習曲線

[英]Learning Curve in Q-learning

原文 2022-02-04 09:31:44 8 1 c++/ reinforcement-learning/ q-learning

我的問題是我在 c++ 中使用 epsilon 貪心策略編寫了 Q 學習算法，現在我必須 plot 的 Q 值的學習曲線。 我應該對 plot 究竟有什么，因為我有一個 11x5 Q 矩陣，所以我應該取一個 Q 值和 plot 它的學習還是我必須取整個矩陣作為學習曲線，你能指導我嗎？ 謝謝

1 個解決方案

RL 中的學習曲線通常是隨時間變化的回報圖，而不是 Q 損失或類似的東西。 所以你應該運行你的環境，計算總獎勵（又名回報）和 plot 它在相應的時間。

Q-learning學習掃雷行為

[英]Q-learning to learn minesweeping behavior

q學習計算中的大量狀態

[英]The huge amount of states in q-learning calculation

如何在 Q-learning 中計算 MaxQ？

[英]How do I calculate MaxQ in Q-learning?

Q學習ludo游戲嗎？

[英]Q learning for ludo game?

實現近似（基於特征）q 學習的問題

[英]Problems with implementing approximate(feature based) q learning

中小型項目的Maven學習曲線和開銷？

[英]Maven learning curve & overhead for small/medium projects?

對於學習曲線和初學者的適合性（HTTP客戶端），提升vs POCO

[英]boost vs POCO as for learning curve and suitability for beginners (HTTP client)

C ++圖形API，學習曲線小 - linux

[英]C++ Graphic API with a small learning curve - linux

[英]Learning inheritance

什么是具有最簡單學習曲線的C ++ GUI構建選項 - VS / Qt / wxWidgets /等？

[英]What's the C++ GUI building option with the easiest learning curve - VS/Qt/wxWidgets/etc.?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Q-learning學習掃雷行為 q學習計算中的大量狀態如何在 Q-learning 中計算 MaxQ？ Q學習ludo游戲嗎？實現近似（基於特征）q 學習的問題中小型項目的Maven學習曲線和開銷？對於學習曲線和初學者的適合性（HTTP客戶端），提升vs POCO C ++圖形API，學習曲線小 - linux 學習繼承什么是具有最簡單學習曲線的C ++ GUI構建選項 - VS / Qt / wxWidgets /等？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM