簡體   English   中英

使用sklearn套袋分類器預測連續值

[英]predict continuous values using sklearn bagging classifier

我可以使用sklearn的BaggingClassifier產生連續的預測嗎? 有類似的包裝嗎? 我的理解是,裝袋分類器使用不同的模型預測幾個分類,然后報告多數答案。 看來該算法可用於為每個分類生成概率函數,然后報告平均值。

trees = BaggingClassifier(ExtraTreesClassifier())
trees.fit(X_train,Y_train)
Y_pred = trees.predict(X_test)

如果您對預測分類器中類的概率感興趣,則可以使用predict_proba方法,該方法為您提供每個類的概率。 這是對代碼的單行更改:

trees = BaggingClassifier(ExtraTreesClassifier())
trees.fit(X_train,Y_train)
Y_pred = trees.predict_proba(X_test)

Y_pred的形狀將為[n_samples, n_classes]

如果您的Y_train值是連續的並且想要預測這些連續值(即,您正在處理回歸問題),則可以改用BaggingRegressor

我通常將BaggingRegressor()用於連續值,然后將性能與RMSE進行比較。 下面的例子:

from sklearn.ensemble import BaggingReressor
trees = BaggingRegressor()
trees.fit(X_train,Y_train)
scores_RMSE = math.sqrt(metrics.mean_squared_error(Y_test, trees.predict(X_test))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM