繁体   English   中英

当行动不影响强化学习中的状态时,这叫什么?

[英]What is it called when the action doesnt affect the state in reinforcement learning?

在强化学习中,是否有一种算法的名称,其中所采取的动作不会影响状态? 例如武装匪徒

在RL环境中, 武装匪徒被认为是无国籍的,因此自然而然的行动不会影响国家。 只有行动和回报。

如果添加一个状态,但是这些动作对下一个状态没有影响,则称为上下文强盗 上下文强盗具有状态,动作和奖励。 您的状态(或“上下文”)可能会影响您的操作,但不会反过来,即没有像普通RL中那样的转换规则。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM