簡體   English   中英

隨機狀態參數在隨機森林算法中的重要性是什么?

[英]What is the importance of random-state parameter in random forest algorithm?

隨機森林有幾個參數之一,它們是隨機狀態。 我不知道它是做什么的,以及它對RF算法的重要性。

隨機森林不過是套在決策樹上的套袋而已,我們需要隨機數來生成適合樹的隨機樣本(自舉樣本)。 但是我們這里可能會有問題,每次您生成一組隨機數時,程序都會生成完全不同的一組隨機數,這再次影響您的引導程序樣本,進而影響所安裝的樹。 因此,為了控制隨機數生成所涉及的隨機性,並在每次使用隨機種子時復制同一組隨機數。 random_state是一個參數,它允許您為隨機森林中的隨機數生成過程設置隨機種子。

關於為什么需要設置隨機種子的一個主要原因是為了實驗的可復制性。 最好設置一個隨機種子,然后開始構建模型,以便每次使用相同數據構建模型時,都獲得完全相同的模型。

設置隨機種子的想法不僅限於隨機森林,任何需要隨機數的算法(神經網絡,決策樹等)都將具有此參數。

希望這可以幫助!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM