cost 66 ms
具有多个变量和产品的强化学习 - Reinforcement learning with multiple variables and products

我最近阅读了很多关于强化学习 (RL) 的文章,所有材料都涵盖了使用一个变量(历史股票价格、历史航班价格)将 RL 应用于一个项目(预测单个股票的价格、单个航班的价格) . 我的用例是,假设我有 1000 种产品在我的网站上销售。 我有这些商品的所有交易的详细信息。 对于每件商品,我想通过查看历史信 ...

PettingZoo 和 Stable-Baselines3 的问题与 ParallelEnv - Problem with PettingZoo and Stable-Baselines3 with a ParallelEnv

我在使用PettingZoo编写的 Custom ParallelEnv时遇到了麻烦。 我正在使用SuperSuit的ss.pettingzoo_env_to_vec_env_v1(env)作为包装器来矢量化环境并使其与Stable-Baseline3一起使用并在此处记录。 您可以找到代码中最相关 ...

深度强化学习,如何制作控制多台机器的代理 - Deep Reinforcement Learning, how to make an agent that control many machines

早上好,我面临一个“RL”问题,它有很多限制,主要想法是我的代理将控制许多不同的机器,例如命令它们出去执行任务(我们不重视任务),或命令他们进入仓库并为他们选择应该坐的正确位置(取决于限制)。 问题是:代理将在定义的时间段内做出决定,对于每个时间段,我们都知道允许哪些动作(出去,进来)。 例如,他将 ...

从我的 PettingZoo 环境中添加一个 TensorBoard 指标 - Add a TensorBoard metric from my PettingZoo environment

我正在使用 Tensorboard 查看我的代理正在玩的 PettingZoo 环境的进度。 我可以看到奖励随着时间的推移而增加,这很好,但我想添加其他特定于我的环境的指标。 即我希望 TensorBoard 向我展示更多包含我的指标的图表以及它们如何随着时间的推移而改进。 我能弄清楚如何做到这一 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM