簡體   English   中英

如何在使用穩定基線3(PPO 實施)時更改 n_steps?

[英]How can I change n_steps while using stable baselines3 (PPO implementation)?

我正在為我的自定義環境從穩定的基線 3 實施 PPO。 現在 n_steps = 2048,所以 model 更新發生在 2048 個時間步之后。 我該如何改變這個,我希望我的 model 在 n_steps = 1000 之后更新?

嘗試將其用作參數:

PPO(n_steps=1000)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM