繁体   English   中英

从主机游戏中获得强化学习的奖励

[英]Obtaining reward from console games for Reinforcement Learning

我正在尝试将强化学习 (RL),例如 Q-learning 或 A3C 用于控制台游戏。 我没有任何这些游戏的源代码,因此可能无法创建环境。 对于 RL,网络需要对其行为进行奖励; 我的问题是如何获得奖励。 例如,在 Halo 中,杀死某人应该是正奖励 (+1),而死则是负奖励 (-1)。 当您击杀或死亡时,屏幕上没有指示。 如果需要,我将使用 Python 和 Tensorflow。

您最好的选择可能是使用音频提示。 我知道当玩家死亡或被击杀时,Halo 播音员会发出特定的声音。

如果张量流有某种方式来抓取音频并与给定样本进行比较,这可能是检查玩家是否被杀死或死亡的有效方法。

免责声明:我以前没有使用过 TensorFlow。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM