簡體   English   中英

R中RandomForest包中的RandomForest函數中的參數'classwt'代表什么?

[英]What does the parameter 'classwt' in RandomForest function in RandomForest package in R stand for?

randomforest::randomforest()的幫助頁面說:

“classwt - 類的推薦。不需要加一個。忽略回歸。”

當您有大量不平衡數據時,可以設置classwt參數,即。 班級的先輩們有很大的不同?

當在具有3個類的數據集上訓練模型時,我應該如何設置classwt ,其中矢量的先驗等於(p1,p2,p3),並且在測試集先驗中是(q1,q2,q3)?

當你有大量不平衡的數據時,可以設置classwt參數幫助 - 類的先驗強烈不同?

是的,設置classwt的值對於不平衡的數據集非常有用。 我同意朱蘭的觀點,這些價值觀是根據采樣訓練數據的概率進行的(根據布萊曼在其原始文章中的論點)。

如何在具有3個類的訓練數據集中設置classwt,你的矢量先驗等於(p1,p2,p3),並且在測試集先驗中是(q1,q2,q3)?

對於培訓,您可以簡單地指定

rf <- randomForest(x=x, y=y, classwt=c(p1,p2,p3))

對於測試集,不能使用先驗:1)randomForest包的predict方法中沒有這樣的選項; 2)權重僅對模型的訓練有意義,而對預測沒有意義。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM