[英]Difference between nearest times in time two time series
我有一个时间序列,两个事件(x和y)不规则地发生。 我正在尝试编写一些描述从x到最近y事件的时间的脚本。
例如:
Time x y
11:01:00 1 0
11:03:04 0 1
11:03:34 0 0
11:06:12 1 1
11:12:00 0 0
我正在尝试创建一个向量,其中每一行是从y中的每个'1'到x向量中最接近的'1'的时间。
因此,以上将返回:
diff
02:04 (closest point is the previous row here)
0 (occurred on the same row so time difference is 0)
05:48 (occurred on the previous row)
可重复的例子:
time<-c("11:01:00","11:03:04","11:03:34","11:06:12","11:12:00")
x<-c(1,0,0,1,0)
y<-c(0,1,0,1,0)
df<-data.frame(time,x,y)
我不太确定如何解决此问题,我们将不胜感激!
我们可以通过几个步骤完成:
首先,将您的数据转换为POSIXct格式,以便我们可以在时间列上使用算术
df$time <- as.POSIXct(df$time, format = "%H:%M:%S")
然后,我们创建两个新列,索引为x,其中x为1。我假设您的数据按时间顺序排列。
df$nextx <- ifelse(df$x == 1, which(df$x == 1), NA)
df$prevx <- rev(ifelse(df$x == 1, which(df$x == 1), NA))
通过使用tidyr :: fill,我们填写xx,以获得每个y的下一个和上一个x:
library(tidyr)
df <- df %>% fill(nextx, rev(prevx))
然后,我们使用pmin查找每一行的最小距离:
x = pmin(abs(df$time - df$time[df$nextx]), abs(df$time - df$time[df$prevx]))
和具有ys的行的子集:
x[df$y == 1]
Time differences in secs
[1] 124 0
(大概是,您希望您的数据的y的最后一位为1,在这种情况下,我们将得到您想要的答案):
Time differences in secs
[1] 124 0 348
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.