簡體 English 中英

如何實現強化學習模型？

[英]How to implement a reinforcement learning model?

原文 2020-10-29 18:38:56 2 1 python/ reinforcement-learning

我有一些關於強化學習的問題。 我已經研究了強化學習的所有數學背景，但我無法編寫這個模型。

我對定義環境感到非常困惑。 我們可以使用 OpenAI 健身房解決各種問題嗎？ 這對我來說沒有意義。 例如，玩游戲不同於股票預測。 但是我怎么在這兩種情況下都看到有人在使用 OpenAI 健身房？

我還找到了以下列表。 論文究竟是什么？ 它們是實現強化學習模型的框架嗎？

你能不能給一個鏈接、來源、視頻、課程或任何可以讓我清楚的東西。

1 個解決方案

OpenAI Gym 是環境的集合。 如果你研究過 RL 的數學背景，那么 Gym 只是一個 MDP 的集合。 然后由您將 RL 算法掛鈎到這些 MDP，並進行實際學習。

您找到的列表可能有點舊，因為 rllab 最近已重命名為garage 。 我不知道其中的大多數，但我會說它們是已經實現的 RL 算法庫（至少 rllab 和 OpenAI 基線是這樣）。 您可以查看他們的代碼，了解他們如何實現不同的 RL 算法。

用Keras模型進行強化學習

[英]Reinforcement Learning with Keras model

調試強化學習 Model (MsPacman)

[英]Debugging Reinforcement Learning Model (MsPacman)

在監督學習模型上應用“強化學習”

[英]Applying “reinforcement learning” on a supervised learning model

非平穩性是什么意思以及如何在強化學習中將其作為 10 臂強盜問題來實現？

[英]What does non-stationarity mean and how to implement it in reinforcement learning as 10 arm bandit problem?

如何使輸入和模型具有相同的形狀（RLlib Ray Sagemaker強化學習）

[英]How to make the inputs and model have the same shape (RLlib Ray Sagemaker reinforcement learning)

如何在 Keras 中實現這種深度學習模型？

[英]How can implement this deep learning model in Keras?

如何使用自己的模型實現遷移學習

[英]How to implement Transfer-Learning with own model

如何更新喀拉拉邦的權重以進行強化學習？

[英]How to update weights in keras for reinforcement learning?

為強化學習實現 LSTM 時間步長

[英]Implement LSTM time_step size for Reinforcement Learning

強化學習，鍾擺蟒蛇

[英]Reinforcement learning, pendulum python

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 用Keras模型進行強化學習調試強化學習 Model (MsPacman) 在監督學習模型上應用“強化學習” 非平穩性是什么意思以及如何在強化學習中將其作為 10 臂強盜問題來實現？如何使輸入和模型具有相同的形狀（RLlib Ray Sagemaker強化學習）如何在 Keras 中實現這種深度學習模型？如何使用自己的模型實現遷移學習如何更新喀拉拉邦的權重以進行強化學習？為強化學習實現 LSTM 時間步長強化學習，鍾擺蟒蛇

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM