[英]What does the parameter 'classwt' in RandomForest function in RandomForest package in R stand for?
randomforest::randomforest()
的幫助頁面說:
“classwt - 類的推薦。不需要加一個。忽略回歸。”
當您有大量不平衡數據時,可以設置classwt
參數,即。 班級的先輩們有很大的不同?
當在具有3個類的數據集上訓練模型時,我應該如何設置classwt
,其中矢量的先驗等於(p1,p2,p3),並且在測試集先驗中是(q1,q2,q3)?
當你有大量不平衡的數據時,可以設置classwt參數幫助 - 類的先驗強烈不同?
是的,設置classwt的值對於不平衡的數據集非常有用。 我同意朱蘭的觀點,這些價值觀是根據采樣訓練數據的概率進行的(根據布萊曼在其原始文章中的論點)。
如何在具有3個類的訓練數據集中設置classwt,你的矢量先驗等於(p1,p2,p3),並且在測試集先驗中是(q1,q2,q3)?
對於培訓,您可以簡單地指定
rf <- randomForest(x=x, y=y, classwt=c(p1,p2,p3))
對於測試集,不能使用先驗:1)randomForest包的predict
方法中沒有這樣的選項; 2)權重僅對模型的訓練有意義,而對預測沒有意義。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.