从我的 PettingZoo 环境中添加一个 TensorBoard 指标

Question

我正在使用 Tensorboard 查看我的代理正在玩的 PettingZoo 环境的进度。 我可以看到奖励随着时间的推移而增加，这很好，但我想添加其他特定于我的环境的指标。 即我希望 TensorBoard 向我展示更多包含我的指标的图表以及它们如何随着时间的推移而改进。

我能弄清楚如何做到这一点的唯一方法是将几行插入到OnPolicyAlgorithm的learn方法中，该方法是 SB3 的一部分。 这行得通，我得到了我想要的图表：

（底部的两个图表是我添加的。）

但显然编辑库代码不是一个好习惯。 我应该在自己的代码中进行修改，而不是在库中。 目前是否有更优雅的方式将我的 PettingZoo 环境中的指标添加到 TensorBoard 中？

Answer 1

您可以添加回调以添加您自己的日志。 请参见下面的示例。 在这种情况下，每一步都会调用回调。 根据您的用例，您还可以使用其他回调。

import numpy as np

from stable_baselines3 import SAC
from stable_baselines3.common.callbacks import BaseCallback

model = SAC("MlpPolicy", "Pendulum-v1", tensorboard_log="/tmp/sac/", verbose=1)


class TensorboardCallback(BaseCallback):
    """
    Custom callback for plotting additional values in tensorboard.
    """

    def __init__(self, verbose=0):
        super(TensorboardCallback, self).__init__(verbose)

    def _on_step(self) -> bool:
        # Log scalar value (here a random variable)
        value = np.random.random()
        self.logger.record('random_value', value)
        return True


model.learn(50000, callback=TensorboardCallback())

从我的 PettingZoo 环境中添加一个 TensorBoard 指标

问题描述

1 个解决方案

解决方案1
0 2022-06-17 17:17:32

从我的 PettingZoo 环境中添加一个 TensorBoard 指标

问题描述

1 个解决方案

解决方案1 0 2022-06-17 17:17:32

解决方案1
0 2022-06-17 17:17:32