如何使sklearn.ensemble.RandomForestRegressor不照顧雜質減少啟發式

Question

我正在使用sklearn的RandomForestRegressor來實現隨機森林插補。 Sklearn允許我們設置參數min_impurity_decrease來指定拆分停止條件的啟發式。 例如，如果min_impurity_decrease = 0.0 ，並且如果節點拆分導致更差的雜質，則該節點將成為葉節點。

問題是，我希望Random Forest能夠完全生長，而不會盡早停止或修剪。 但是必須將min_impurity_decrease設置為非負浮點數。 有什么解決辦法嗎？

直觀地，我試圖設置min_impurity_decrease = float("-inf") ，這會導致錯誤消息。

Answer 1

您顯然必須修改sklearn代碼。 看一下有關如何以可編輯模式安裝sklearn的答案。 確保創建新的虛擬環境，以免弄亂原始的sklearn文件。

好消息是您不必更改任何Cython代碼。 轉到文件sklearn/tree/tree.py 僅在BaseDecisionTree類中檢查min_impurity_decrease的值。 根據Github的說法，在306行中有一個代碼段：

if self.min_impurity_decrease < 0.:
        raise ValueError("min_impurity_decrease must be greater than "
                         "or equal to 0")

只需刪除它並重新加載庫即可。 我無法測試此解決方案，所以如果您遇到任何問題，請告訴我。

如何使sklearn.ensemble.RandomForestRegressor不照顧雜質減少啟發式

問題描述

1 個解決方案

解決方案1
0 2019-08-16 11:50:27

如何使sklearn.ensemble.RandomForestRegressor不照顧雜質減少啟發式

問題描述

1 個解決方案

解決方案1 0 2019-08-16 11:50:27

解決方案1
0 2019-08-16 11:50:27