繁体 English 中英

在强化学习中，agent 需要提前知道奖励函数吗？

[英]Does agent need to know reward function in advance in Reinforcement Learning?

原文 2019-12-08 07:20:00 5 1 machine-learning/ reinforcement-learning/ q-learning

像 Q learning 一样，我们有奖励反馈，这是否意味着代理需要提前知道？

1 个解决方案

代理不需要了解奖励函数。 但它应该为所采取的每一步获得奖励。 请注意，我们可以在剧集结束之前获得零奖励。 术语奖励反馈意味着每个转换都有一些标量值。

强化学习 - 代理如何知道要选择哪个动作？

[英]Reinforcement Learning - How does an Agent know which action to pick?

强化学习中的负面奖励

[英]Negative reward in reinforcement learning

强化学习 - 当游戏的输入只有像素时，我们如何决定对代理的奖励？

[英]Reinforcement Learning - How to we decide the reward to the agent when the input to the game is only pixels?

如何奖励强化学习中的两个参数？

[英]How to reward for two parameters in reinforcement learning?

从主机游戏中获得强化学习的奖励

[英]Obtaining reward from console games for Reinforcement Learning

我需要帮助来了解强化学习代码

[英]I need help understanding reinforcement learning code

是否有任何技术可以预先知道使深度学习获得良好表现所需的训练示例数量？

[英]Is there any technique to know in advance the amount of training examples you need to make deep learning get good performance?

如何让强化学习者学习无尽的跑步者？

[英]How to make an reinforcement learning agent learn an endless runner?

强化学习文献中的“软”是什么意思？

[英]What does "soft" in reinforcement learning literature mean?

[英]Reinforcement Learning

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 强化学习 - 代理如何知道要选择哪个动作？强化学习中的负面奖励强化学习 - 当游戏的输入只有像素时，我们如何决定对代理的奖励？如何奖励强化学习中的两个参数？从主机游戏中获得强化学习的奖励我需要帮助来了解强化学习代码是否有任何技术可以预先知道使深度学习获得良好表现所需的训练示例数量？如何让强化学习者学习无尽的跑步者？强化学习文献中的“软”是什么意思？强化学习

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM