![](/img/trans.png)
[英]I want to call some layers during training (but not inference) - the gradients don't seem to flow through these layers
我正在使用帶有 ray.tune() 的自定義 PPO model,我想添加一些依賴於 batch['obs']、batch['done']、batch['action'] 和 batch 的自我監督學習['next_obs'] 我在我的 model 中定義了一些僅在訓練期間調用的層。 我已經定義了 ...