繁体   English   中英

如何预测R中的数据缺少值

[英]How to predict data in r for missing values

我有一个大小为60的数据集,所有观察值都具有相同的变量。 其中30个具有获胜值(y),而我已删除其中30个以作预测。

在sas中,当您希望模型预测未知的y值(结果)时,可以在数据行中为Y值放置一个点并运行回归。 该模型将基于具有Y值的30个观测值,然后针对没有Y值的30个观测值进行预测。

在r中,我将要预测的那些观测值的Y值作为NA。 但是,该模型将忽略那些缺失的值,而不给出这些观测值的预测结果。

如何让模型预测缺少的Y变量的值?

如果您要尝试对样本数据进行预测,请执行以下操作:

# Here I just generate some data, since no provided
X <- matrix(data = rnorm(400), ncol = 4)
B <- c(0.5, -0.5, 2, 0)
y <- X %*% B
dt <- data.frame(cbind(y, X))
names(dt) <- c("y", paste0("x", 1:4))

# Start with estimation on in-sample 
train_dt <- dt[1:50, ]
mod <- lm(formula = y ~ ., data = train_dt)

# Predict on out of sample
that <– predict(object = mod, newdata = dt[51:100, ])

# Calculate error, should be almost the same
eps <- yhat - y[51:100]

# In this example should be close to zero
all(eps) < 1e-10)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM