具有持續數據的線性回歸，在 R 中

Question

型號

y ~ x1 + x2 + x3

約 1000 行

我想做的是“一步一步”做預測

使用 0:20 行預測 21:30 的 y，然后使用 11:30 預測 31:40 的 y，依此類推。

Answer 1

您可以使用predict功能：

mod = lm(y ~ ., data=df[1:990,])
pred = predict(mod, newdata=df[991:1000,2:4])

編輯：在循環中更改訓練數據的范圍：

index = seq(10,990,10)
pred = matrix(nrow=10, ncol=length(index)) 

for(i in index){
  mod = lm(y ~ ., data=df[1:i,])
  pred[,i/10] = predict(mod, newdata=df[(i+1):(i+10),2:4])
  MSE[i/10] = sum((df$y[(i+1):(i+10)]-pred[,i/10])^2)}

mean(MSE)

Answer 2

你在尋找這樣的東西嗎？

# set up mock data
set.seed(1)
df <- data.frame(y = rnorm(1000),
                 x1 = rnorm(1000),
                 x2 = rnorm(1000),
                 x3 = rnorm(1000))

# for loop
prd <- list()

for(i in 1:970){
 
 # training data
 trn <- df[i:(i+20), ]

 # test data
 tst <- df[(i+21):(i+30), ]
 
 # lm model 
 mdl <- lm(y ~ x1 + x2 + x3, trn)

 # append a list of data.frame with both predicted and actual values
 # for later confrontation
 prd[[i]] <- data.frame(prd = predict(mdl, tst[-1]),
                        act = tst[[1]])
 
}

# your list
prd

您還可以使用包slider嘗試更有趣的東西：

# define here your model and how you wanna handle the preditions
sliding_lm <- function(..., frm, n_trn, n_tst){

 df <- data.frame(...)
 trn <- df[1:n_trn, ]
 tst <- df[n_trn+1:n_tst, ]
 
 mdl <- lm(y ~ x1 + x2 + x3, trn)
 data.frame(prd = predict(mdl, tst[-1]),
            act = tst[[1]])
 
}

n_trn <- 20 # number of training obs
n_tst <- 10 # number of test obs
frm <- y ~ x1 + x2 + x3 # formula of your model

prd <- slider::pslide(df, sliding_lm, 
                      frm = frm,
                      n_trn = n_trn,
                      n_tst = n_tst,
                      .after = n_trn + n_tst, 
                      .complete = TRUE)

請注意，列表中的最后 30 個條目為 NULL，因為您只查看完整的窗口 [30 個訓練和測試觀察值]

具有持續數據的線性回歸，在 R 中

問題描述

2 個解決方案

解決方案1
0 2020-10-20 12:26:33

解決方案2
0 2020-10-20 12:45:01

具有持續數據的線性回歸，在 R 中

問題描述

2 個解決方案

解決方案1 0 2020-10-20 12:26:33

解決方案2 0 2020-10-20 12:45:01

解決方案1
0 2020-10-20 12:26:33

解決方案2
0 2020-10-20 12:45:01