簡體   English   中英

如何預測R中的數據缺少值

[英]How to predict data in r for missing values

我有一個大小為60的數據集,所有觀察值都具有相同的變量。 其中30個具有獲勝值(y),而我已刪除其中30個以作預測。

在sas中,當您希望模型預測未知的y值(結果)時,可以在數據行中為Y值放置一個點並運行回歸。 該模型將基於具有Y值的30個觀測值,然后針對沒有Y值的30個觀測值進行預測。

在r中,我將要預測的那些觀測值的Y值作為NA。 但是,該模型將忽略那些缺失的值,而不給出這些觀測值的預測結果。

如何讓模型預測缺少的Y變量的值?

如果您要嘗試對樣本數據進行預測,請執行以下操作:

# Here I just generate some data, since no provided
X <- matrix(data = rnorm(400), ncol = 4)
B <- c(0.5, -0.5, 2, 0)
y <- X %*% B
dt <- data.frame(cbind(y, X))
names(dt) <- c("y", paste0("x", 1:4))

# Start with estimation on in-sample 
train_dt <- dt[1:50, ]
mod <- lm(formula = y ~ ., data = train_dt)

# Predict on out of sample
that <– predict(object = mod, newdata = dt[51:100, ])

# Calculate error, should be almost the same
eps <- yhat - y[51:100]

# In this example should be close to zero
all(eps) < 1e-10)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM