繁体   English   中英

如何用R计算时间序列数据的持续时间?

[英]How to calculate the duration in time series data with R?

mydata<-data.frame(t=lubridate::ymd(c("2018-1-1","2018-1-2","2018-1-5","2018-1-6","2018-1-7","2018-1-8")),x=c(3,1,1,3,1,3))
ggplot(mydata,aes(t,x))+geom_line()

在此处输入图片说明 在这种情况下,我想知道 x < 2 的持续时间(其中 5 包括“1-2,1-3,1-4,1-5,1-7”)。如何使用 R 做到这一点?

像这样使用dplyr::lag怎么样?

# Calculate time difference to previous date
mydata$diff <- mydata$t - dplyr::lag(mydata$t);

as.numeric(sum(mydata$diff[mydata$x < 2]))
#[1] 5

或者使用完整的tidyverse方法:

require(tidyverse);
mydata %>% 
    mutate(diff = t - lag(t)) %>%
    summarise(duration = sum(diff[x < 2]));
#    duration
#1   5 days

样本数据

mydata<-data.frame(
    t = lubridate::ymd(c("2018-1-1", "2018-1-2", "2018-1-5", "2018-1-6", "2018-1-7", "2018-1-8")),
    x = c(3, 1, 1, 3, 1, 3));

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM