繁体 English 中英

从主机游戏中获得强化学习的奖励

[英]Obtaining reward from console games for Reinforcement Learning

原文 2018-02-07 04:20:50 0 1 python/ tensorflow/ machine-learning/ computer-vision/ reinforcement-learning

我正在尝试将强化学习 (RL)，例如 Q-learning 或 A3C 用于控制台游戏。 我没有任何这些游戏的源代码，因此可能无法创建环境。 对于 RL，网络需要对其行为进行奖励； 我的问题是如何获得奖励。 例如，在 Halo 中，杀死某人应该是正奖励 (+1)，而死则是负奖励 (-1)。 当您击杀或死亡时，屏幕上没有指示。 如果需要，我将使用 Python 和 Tensorflow。

1 个解决方案

您最好的选择可能是使用音频提示。 我知道当玩家死亡或被击杀时，Halo 播音员会发出特定的声音。

如果张量流有某种方式来抓取音频并与给定样本进行比较，这可能是检查玩家是否被杀死或死亡的有效方法。

免责声明：我以前没有使用过 TensorFlow。

强化学习中的负面奖励

[英]Negative reward in reinforcement learning

奖励正在收敛，但强化学习中的动作不正确

[英]Reward is converging but actions are not correct in reinforcement learning

REINFORCE 深度强化学习算法中的折扣奖励

[英]Discount reward in REINFORCE deep reinforcement learning algorithm

在强化学习的策略梯度中反向传播什么损失或奖励？

[英]What Loss Or Reward Is Backpropagated In Policy Gradients For Reinforcement Learning?

【强化学习】为什么我的reward变成0就结束了？我在健身房环境方面遇到了一些麻烦

[英][Reinforcement Learning]Why does my reward become 0 and end? I have some trouble with gym environment

强化学习 - 当游戏的输入只有像素时，我们如何决定对代理的奖励？

[英]Reinforcement Learning - How to we decide the reward to the agent when the input to the game is only pixels?

强化学习，钟摆蟒蛇

[英]Reinforcement learning, pendulum python

强化学习中的时间步长

[英]Time step in reinforcement learning

简单的界面用于强化学习

[英]Simple interface for reinforcement learning

监督数据集上的强化学习

[英]Reinforcement Learning on a Supervised Dataset

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 强化学习中的负面奖励奖励正在收敛，但强化学习中的动作不正确 REINFORCE 深度强化学习算法中的折扣奖励在强化学习的策略梯度中反向传播什么损失或奖励？【强化学习】为什么我的reward变成0就结束了？我在健身房环境方面遇到了一些麻烦强化学习 - 当游戏的输入只有像素时，我们如何决定对代理的奖励？强化学习，钟摆蟒蛇强化学习中的时间步长简单的界面用于强化学习监督数据集上的强化学习

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM