[英]reinforcement learning mini-golf game
我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏。
我想我可以通过使用贪婪方法或函数逼近来实现。 我想知道这是否可行,并想找到一个类似的例子。
在文献中,强化学习是最接近人工智能的事物,因此,可以将其应用于这款迷你高尔夫游戏。
以下是布局:
状态:球在球场上的位置(x,y,z)
动作:角度,力
奖励:球到洞的距离
根据您的领域大小,此问题应该可以轻松解决。
我想我可以通过使用贪婪方法或函数逼近来实现。
您肯定要至少使用电子贪婪方法来促进早期情节中的探索。
为了简化问题 ,我将首先考虑2D甚至是1D情况,以便您熟悉算法。
对于一维情况,您的状态将是球沿线的位置。 您的动作是施加到球上的力量。 奖励可以基于您的球距球门柱有多远。
如果您愿意,我可以为您编写此环境的代码。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.