繁体   English   中英

R中的binned生理时间序列数据:计算在每个bin中花费的时长

[英]Binned physiological time series data in R: calculate duration spent in each bin

我有一个数据集,其中包含多个参与者的平均动脉血压 (MAP) 随时间的变化。 这是一个示例 dataframe:

df=structure(list(ID = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 
                            2L, 2L, 2L, 2L, 2L), Time = structure(1:14, .Label = c("11:02:00", 
                                                                                   "11:03:00", "11:04:00", "11:05:00", "11:06:00", "11:07:00", "11:08:00", 
                                                                                   "13:30:00", "13:31:00", "13:32:00", "13:33:00", "13:34:00", "13:35:00", 
                                                                                   "13:36:00"), class = "factor"), MAP = c(90.27999878, 84.25, 74.81999969, 
                                                                                                                           80.87000275, 99.38999939, 81.51000214, 71.51000214, 90.08999634, 
                                                                                                                           88.75, 84.72000122, 83.86000061, 94.18000031, 98.54000092, 51
                                                                                   )), class = "data.frame", row.names = c(NA, -14L))

我已将数据分组:例如 MAP 40-60、60-80、80-100,并在附加列 map_bin 中添加了一个唯一标志(1、2 或 3)。 到目前为止,这是我的代码:

library(dplyr)

#Mean Arterial Pressure                                                                                                                     
#Bin 1=40-60; Bin 2=60-80; Bin 3=80-100
map_bin=c("1","2","3")

output <- as_tibble(df) %>% 
  mutate(map_bin = case_when(
    MAP >= 40 & MAP < 60 ~ map_bin[1],
    MAP >= 60 & MAP < 80 ~ map_bin[2],
    MAP >= 80 & MAP < 100 ~ map_bin[3]
  ))

对于我希望计算的每个 ID,在附加列中,每个 bin 中的总时间 MAP。 我期待以下 output:

ID 时间 MAP 地图箱 map_bin_dur
1个 11:02:00 90.27999878 3个 5个
1个 11:03:00 84.25 3个 5个
1个 11:04:00 74.81999969 2个 2个
1个 11:05:00 80.87000275 3个 5个
1个 11:06:00 99.38999939 3个 5个
1个 11:07:00 81.51000214 3个 5个
1个 11:08:00 71.51000214 2个 2个
2个 13:30:00 90.08999634 3个 6个
2个 13:31:00 88.75 3个 6个
2个 13:32:00 84.72000122 3个 6个
2个 13:33:00 83.86000061 3个 6个
2个 13:34:00 94.18000031 3个 6个
2个 13:35:00 98.54000092 3个 6个
2个 13:36:00 51 1个 1个

其中 map_bin_dur 是每个人的 MAP 驻留在每个垃圾箱中的时间(以分钟为单位)。 例如,ID 1 在 Bin 3 中的 MAP 总共持续了 5 分钟。

如果您始终有 1 分钟持续时间的Time列,您可以使用add_count -

library(dplyr)

output <- output %>% add_count(ID, map_bin, name = 'map_bin_dur')
output

#      ID Time       MAP map_bin map_bin_dur
#   <int> <fct>    <dbl> <chr>         <int>
# 1     1 11:02:00  90.3 3                 5
# 2     1 11:03:00  84.2 3                 5
# 3     1 11:04:00  74.8 2                 2
# 4     1 11:05:00  80.9 3                 5
# 5     1 11:06:00  99.4 3                 5
# 6     1 11:07:00  81.5 3                 5
# 7     1 11:08:00  71.5 2                 2
# 8     2 13:30:00  90.1 3                 6
# 9     2 13:31:00  88.8 3                 6
#10     2 13:32:00  84.7 3                 6
#11     2 13:33:00  83.9 3                 6
#12     2 13:34:00  94.2 3                 6
#13     2 13:35:00  98.5 3                 6
#14     2 13:36:00  51   1                 1

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM