![](/img/trans.png)
[英]Reinforcement learning with multiple variables and products
我最近閱讀了很多關於強化學習 (RL) 的文章,所有材料都涵蓋了使用一個變量(歷史股票價格、歷史航班價格)將 RL 應用於一個項目(預測單個股票的價格、單個航班的價格) . 我的用例是,假設我有 1000 種產品在我的網站上銷售。 我有這些商品的所有交易的詳細信息。 對於每件商品,我想通過查看歷史信 ...
[英]Reinforcement learning with multiple variables and products
我最近閱讀了很多關於強化學習 (RL) 的文章,所有材料都涵蓋了使用一個變量(歷史股票價格、歷史航班價格)將 RL 應用於一個項目(預測單個股票的價格、單個航班的價格) . 我的用例是,假設我有 1000 種產品在我的網站上銷售。 我有這些商品的所有交易的詳細信息。 對於每件商品,我想通過查看歷史信 ...
[英]Problem with PettingZoo and Stable-Baselines3 with a ParallelEnv
我在使用PettingZoo編寫的 Custom ParallelEnv時遇到了麻煩。 我正在使用SuperSuit的ss.pettingzoo_env_to_vec_env_v1(env)作為包裝器來矢量化環境並使其與Stable-Baseline3一起使用並在此處記錄。 您可以找到代碼中最相關 ...
[英]Deep Reinforcement Learning, how to make an agent that control many machines
早上好,我面臨一個“RL”問題,它有很多限制,主要想法是我的代理將控制許多不同的機器,例如命令它們出去執行任務(我們不重視任務),或命令他們進入倉庫並為他們選擇應該坐的正確位置(取決於限制)。 問題是:代理將在定義的時間段內做出決定,對於每個時間段,我們都知道允許哪些動作(出去,進來)。 例如,他將 ...
[英]Add a TensorBoard metric from my PettingZoo environment
我正在使用 Tensorboard 查看我的代理正在玩的 PettingZoo 環境的進度。 我可以看到獎勵隨着時間的推移而增加,這很好,但我想添加其他特定於我的環境的指標。 即我希望 TensorBoard 向我展示更多包含我的指標的圖表以及它們如何隨着時間的推移而改進。 我能弄清楚如何做到這一 ...