如何根據R中的決策樹模型測試數據？

Question

我使用R中的rpart包從訓練數據構建了一個決策樹。現在我有更多數據，我想在樹上檢查它以檢查模型。 邏輯/迭代，我想做以下事情：

for each datapoint in new data
     run point thru decision tree, branching as appropriate
     examine how tree classifies the data point
     determine if the datapoint is a true positive or false positive

我如何在R中做到這一點？

Answer 1

為了能夠使用它，我假設您將訓練集分成子集訓練集和測試集。

要創建訓練模型，您可以使用：

model <- rpart(y~., traindata, minbucket=5)   # I suspect you did it so far.

要將其應用於測試集：

pred <- predict(model, testdata)

然后，您將獲得預測結果的向量。

在您的訓練測試數據集中，您也有“真實”的答案。 讓我們說一下訓練集中的最后一列。

簡單地將它們等同將產生結果：

pred == testdata[ , last]  # where 'last' equals the index of 'y'

當元素相等時，你會得到一個真，當你得到一個假，這意味着你的預測是錯誤的。

pred + testdata[, last] > 1 # gives TRUE positive, as it means both vectors are 1
pred == testdata[, last]    # gives those that are correct

看看你有多少正確率可能會很有趣：

mean(pred == testdata[ , last])    # here TRUE will count as a 1, and FALSE as 0

如何根據R中的決策樹模型測試數據？

問題描述

1 個解決方案

解決方案1
6 已采納 2013-10-27 16:58:53

如何根據R中的決策樹模型測試數據？

問題描述

1 個解決方案

解決方案1 6 已采納 2013-10-27 16:58:53

解決方案1
6 已采納 2013-10-27 16:58:53