簡體   English   中英

怎么修 ”'。' 在公式中並且沒有“數據”參數”使用randomForest函數時?

[英]How to fix “'.' in formula and no 'data' argument” when using randomForest function?

我正在嘗試用我的數據建立一個隨機森林回歸模型。 對於第一個參數,我編寫了公式,然后指定了數據,最后編寫了所需樹的數量。

rf_model = randomForest(targetVar ~., data = train, ntree = 50)

執行此行代碼時遇到的錯誤是:

Error in terms.formula(formula, data = data) : 
'.' in formula and no 'data' argument

是什么導致錯誤? 這是隨機森林回歸模型的非常簡單明了的實現。 另外,關於錯誤的閱讀並沒有屈服於任何有效的解決方案。

問題不在於randomForest函數。 它與train數據集有關,以及如何指示randomForest處理它。

  1. 您必須指示randomForest()如何處理NA值。 例如,您必須設置na.action=na.omit
  2. 您的數據集變量太多-randomForest抱怨53個變量太多。

因此,作為一個例子,我將向您展示如何使用2個變量來使其工作。

train <- read.csv('<path to>/Train.csv', header=TRUE, sep = ",")
sales <- randomForest(Item_Outlet_Sales~Item_MRP+Item_Weight, data = train, ntree=50, na.action=na.omit)
sales

na.omit不是唯一可用的功能。 請參閱文檔以獲取更多NA處理功能。

您必須查看要使用的變量。 希望這可以幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM