簡體   English   中英

隨機森林預測

[英]Random Forest Predict

我有一個包含40,000行的訓練數據集,並且能夠為我的數據集成功生成randomForest

我現在嘗試使用它來預測我的測試集。 我的訓練和測試數據集是2個不同的數據框,兩個數據框之間的列名稱不匹配。 運行預測時出現錯誤。

library(randomForest)
set.seed(2018)
new_train_rf= randomForest(workdf.V1~.,data = new_train_df, mtry=6, ntree=25)
new_train_rf
summary(new_train_rf)

測試數據集預測:

test_pred = predict(new_train_rf, newdata=new_test_df)
test_pred
summary(test_pred)

eval(predvars,data,env)中的錯誤:找不到對象'Var57'

測試數據框中的列名稱:

testdf.Var218_UYBR, testdf2.Var6, testdf2.Var13, testdf2.Var21

Training Datafame中的列名稱:

workdf.Var218_UYBR, tempdf2.Var6, tempdf2.Var13, tempdf2.Var21

請幫忙! 我是R的新手,我一直在努力弄清楚為什么我的預測不起作用

我將測試和培訓數據分為2個不同的數據幀。 在將df(測試和培訓)中的列重命名以匹配之后,我能夠成功運行預測。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM