簡體   English   中英

在強化學習中,agent 和 environment 有不同的狀態還是只有一種狀態?

[英]In Reinforcement learning , do both agent and environment have different states or there is only one state?

是環境狀態還是代理狀態? 我在某處閱讀環境也有狀態。 兩者有何不同?

狀態代表從代理看到的環境。

如果你想說某個屬性是代理的一部分(假設你有一輛車並且你聲明它的速度屬於代理),那么狀態包含這個屬性但它是環境的一部分,因為你的代理存在於環境。

然后,當您有多個代理時,所有代理都可以通過狀態“可視化”環境,但每個代理都可能不同。

例如

如果您有多個機器人在打牌,則每個機器人將環境表示為可見的牌和它手中的牌。 因此,您的所有代理(機器人)將對環境有不同的感知,從而產生不同的狀態來表示它們。 在這種情況下,您可以說“代理的狀態”,這只是措辭問題。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM