[英]predict continuous values using sklearn bagging classifier
我可以使用sklearn的BaggingClassifier
產生連續的預測嗎? 有類似的包裝嗎? 我的理解是,裝袋分類器使用不同的模型預測幾個分類,然后報告多數答案。 看來該算法可用於為每個分類生成概率函數,然后報告平均值。
trees = BaggingClassifier(ExtraTreesClassifier())
trees.fit(X_train,Y_train)
Y_pred = trees.predict(X_test)
如果您對預測分類器中類的概率感興趣,則可以使用predict_proba
方法,該方法為您提供每個類的概率。 這是對代碼的單行更改:
trees = BaggingClassifier(ExtraTreesClassifier())
trees.fit(X_train,Y_train)
Y_pred = trees.predict_proba(X_test)
Y_pred
的形狀將為[n_samples, n_classes]
。
如果您的Y_train
值是連續的並且想要預測這些連續值(即,您正在處理回歸問題),則可以改用BaggingRegressor
。
我通常將BaggingRegressor()用於連續值,然后將性能與RMSE進行比較。 下面的例子:
from sklearn.ensemble import BaggingReressor
trees = BaggingRegressor()
trees.fit(X_train,Y_train)
scores_RMSE = math.sqrt(metrics.mean_squared_error(Y_test, trees.predict(X_test))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.