![](/img/trans.png)
[英]Monte carlo tree search keeps getting stuck in an infinite loop when playing (as opposed to training)
我已經嘗試為一個簡單的棋盤游戲制作自己的蒙特卡洛樹搜索算法的實現,並且它在學習時似乎工作合理。 但是,當我從播放模式切換到競技場模式進行評估時,mcts 陷入無限循環。 這樣做的原因是,在學習它時,它會根據概率偽隨機選擇動作,但在競技場模式下,這會切換為選擇最有可能獲勝的動作。 不幸的是,在其中一 ...