[英]How to implement a reinforcement learning model?
OpenAI Gym 是環境的集合。 如果你研究過 RL 的數學背景,那么 Gym 只是一個 MDP 的集合。 然后由您將 RL 算法掛鈎到這些 MDP,並進行實際學習。
您找到的列表可能有點舊,因為 rllab 最近已重命名為garage 。 我不知道其中的大多數,但我會說它們是已經實現的 RL 算法庫(至少 rllab 和 OpenAI 基線是這樣)。 您可以查看他們的代碼,了解他們如何實現不同的 RL 算法。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.