[英]In R, compute time series difference of lagged values
您好,我的数据框在很多年和产品中看起来像这样:
product<-c(1,2,3)
yr1<-c(109,213,30)
yr2<-c(613,488,125)
yr3<-c(729,494,127)
df<-data.frame(product,yr1,yr2,yr3)
我需要对其进行转换,以便第一个年份之后的值是当前值与前一个(滞后)值的差,使其看起来像这样:
yr2<-c(504,275,95)
yr3<-c(116,6,2)
df<-data.frame(product,yr1,yr2,yr3)
613-109=504、729-613=116等
我怎样才能做到这一点?
带有cur_data
的dplyr
选项,它会复制数据以将每一列与其前一列相减:
library(dplyr)
df %>%
mutate(cur_data()[,c(-2)] - cur_data()[-ncol(.)]) %>%
mutate(product = df$product)
输出:
product yr1 yr2 yr3
1 1 109 504 116
2 2 213 275 6
3 3 30 95 2
尝试
df[,tail(grep("yr",colnames(df)),-1)]-df[,head(grep("yr",colnames(df)),-1)]
yr2 yr3
1 504 116
2 275 6
3 95 2
另一种dplyr
方法:
library(dplyr)
df %>%
mutate(yr1 = NULL, across(-product, ~ .x-df[which(cur_column() == names(df))-1]))
#> product yr1 yr2
#> 1 1 504 116
#> 2 2 275 6
#> 3 3 95 2
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.