簡體   English   中英

如何實現強化學習模型?

[英]How to implement a reinforcement learning model?

我有一些關於強化學習的問題。 我已經研究了強化學習的所有數學背景,但我無法編寫這個模型。

我對定義環境感到非常困惑。 我們可以使用 OpenAI 健身房解決各種問題嗎? 這對我來說沒有意義。 例如,玩游戲不同於股票預測。 但是我怎么在這兩種情況下都看到有人在使用 OpenAI 健身房?

我還找到了以下列表。 論文究竟是什么? 它們是實現強化學習模型的框架嗎?

在此處輸入圖片說明

你能不能給一個鏈接、來源、視頻、課程或任何可以讓我清楚的東西。

OpenAI Gym 是環境的集合。 如果你研究過 RL 的數學背景,那么 Gym 只是一個 MDP 的集合。 然后由您將 RL 算法掛鈎到這些 MDP,並進行實際學習。

您找到的列表可能有點舊,因為 rllab 最近已重命名為garage 我不知道其中的大多數,但我會說它們是已經實現的 RL 算法庫(至少 rllab 和 OpenAI 基線是這樣)。 您可以查看他們的代碼,了解他們如何實現不同的 RL 算法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM