[英]How to fix “'.' in formula and no 'data' argument” when using randomForest function?
我正在嘗試用我的數據建立一個隨機森林回歸模型。 對於第一個參數,我編寫了公式,然后指定了數據,最后編寫了所需樹的數量。
rf_model = randomForest(targetVar ~., data = train, ntree = 50)
執行此行代碼時遇到的錯誤是:
Error in terms.formula(formula, data = data) :
'.' in formula and no 'data' argument
是什么導致錯誤? 這是隨機森林回歸模型的非常簡單明了的實現。 另外,關於錯誤的閱讀並沒有屈服於任何有效的解決方案。
問題不在於randomForest
函數。 它與train
數據集有關,以及如何指示randomForest
處理它。
randomForest()
如何處理NA
值。 例如,您必須設置na.action=na.omit
。 因此,作為一個例子,我將向您展示如何使用2個變量來使其工作。
train <- read.csv('<path to>/Train.csv', header=TRUE, sep = ",")
sales <- randomForest(Item_Outlet_Sales~Item_MRP+Item_Weight, data = train, ntree=50, na.action=na.omit)
sales
na.omit
不是唯一可用的功能。 請參閱文檔以獲取更多NA處理功能。
您必須查看要使用的變量。 希望這可以幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.