[英]Data Formatting for Time Varying Covariate Cox Proportional Hazards Modeling in R
[英]Cox PH time-dependent covariate formatting in R
我正在尝试使用 R 中的时间相关协变量执行 Cox 比例风险分析。 我已经阅读了相关文档(Therneau 等人)和几个教程,但是考虑到协变量在数据中的结构,我正在努力正确地格式化我的数据。 它是分段的时间相关/时变协变量。
感兴趣的结果是“死亡”,时间变量是“fu”,时间相关的协变量包含在“asp”AKA 阿司匹林列中。 例如,对于第一个病例,患者在基线、30 天和 1 年没有服用阿司匹林,但在最后一次随访时服用,在这种情况下为 2275 天。 句点代表缺失的数据。
| ID | aspb | asp30 | asp1y | aspfu | death | fu |
|-------|------|-------|-------|-------|-------|-----------|
| 1479 | 0 | 0 | 0 | 1 | 0 | 2275 |
| 10523 | 1 | 1 | . | . | 1 | 41 |
| 25436 | 0 | 0 | 1 | 1 | 0 | 1773 |
我不知道如何实现表格的(开始,停止)格式,因为有1000多个案例。这也很复杂,因为案例之间的时间间隔不一定一致,即时间对应于“ aspfu" 可以介于 0 天、30 天、1 年、...
我确实在 SPSS 中使用时间相关协变量的以下符号完成了这个分析: (T_ < 1)*aspb + (T_ >=1 & T_ < 31)*asp30 + (T_ >= 31 & T_ < 366)* asp1y + (T_ >= 366)*aspfu。 但我正在努力将其翻译成 R。
任何指导将不胜感激! 非常感谢!
尝试这个:
## start time
df <- df %>%
group_by(ID) %>%
mutate(start_time = 0:(n() - 1))
df <- ungroup(df)
## end time
df <- df %>%
group_by(ID) %>%
mutate(end_time = 1:(n()))
df <- ungroup(df)
```
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.