簡體   English   中英

在 R 中,計算滯后值的時間序列差

[英]In R, compute time series difference of lagged values

您好,我的數據框在很多年和產品中看起來像這樣:

product<-c(1,2,3)
yr1<-c(109,213,30)
yr2<-c(613,488,125)
yr3<-c(729,494,127)
df<-data.frame(product,yr1,yr2,yr3)

我需要對其進行轉換,以便第一個年份之后的值是當前值與前一個(滯后)值的差,使其看起來像這樣:

yr2<-c(504,275,95)
yr3<-c(116,6,2)
df<-data.frame(product,yr1,yr2,yr3)

613-109=504、729-613=116等

我怎樣才能做到這一點?

帶有cur_datadplyr選項,它會復制數據以將每一列與其前一列相減:

library(dplyr)
df %>% 
  mutate(cur_data()[,c(-2)] - cur_data()[-ncol(.)]) %>%
  mutate(product = df$product)

輸出:

  product yr1 yr2 yr3
1       1 109 504 116
2       2 213 275   6
3       3  30  95   2

嘗試

df[,tail(grep("yr",colnames(df)),-1)]-df[,head(grep("yr",colnames(df)),-1)]

  yr2 yr3
1 504 116
2 275   6
3  95   2

另一種dplyr方法:

library(dplyr)

df %>% 
 mutate(yr1 = NULL, across(-product, ~ .x-df[which(cur_column() == names(df))-1]))

#>   product yr1 yr2
#> 1       1 504 116
#> 2       2 275   6
#> 3       3  95   2

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM