![](/img/trans.png)
[英]Data Formatting for Time Varying Covariate Cox Proportional Hazards Modeling in R
[英]Cox PH time-dependent covariate formatting in R
我正在嘗試使用 R 中的時間相關協變量執行 Cox 比例風險分析。 我已經閱讀了相關文檔(Therneau 等人)和幾個教程,但是考慮到協變量在數據中的結構,我正在努力正確地格式化我的數據。 它是分段的時間相關/時變協變量。
感興趣的結果是“死亡”,時間變量是“fu”,時間相關的協變量包含在“asp”AKA 阿司匹林列中。 例如,對於第一個病例,患者在基線、30 天和 1 年沒有服用阿司匹林,但在最后一次隨訪時服用,在這種情況下為 2275 天。 句點代表缺失的數據。
| ID | aspb | asp30 | asp1y | aspfu | death | fu |
|-------|------|-------|-------|-------|-------|-----------|
| 1479 | 0 | 0 | 0 | 1 | 0 | 2275 |
| 10523 | 1 | 1 | . | . | 1 | 41 |
| 25436 | 0 | 0 | 1 | 1 | 0 | 1773 |
我不知道如何實現表格的(開始,停止)格式,因為有1000多個案例。這也很復雜,因為案例之間的時間間隔不一定一致,即時間對應於“ aspfu" 可以介於 0 天、30 天、1 年、...
我確實在 SPSS 中使用時間相關協變量的以下符號完成了這個分析: (T_ < 1)*aspb + (T_ >=1 & T_ < 31)*asp30 + (T_ >= 31 & T_ < 366)* asp1y + (T_ >= 366)*aspfu。 但我正在努力將其翻譯成 R。
任何指導將不勝感激! 非常感謝!
嘗試這個:
## start time
df <- df %>%
group_by(ID) %>%
mutate(start_time = 0:(n() - 1))
df <- ungroup(df)
## end time
df <- df %>%
group_by(ID) %>%
mutate(end_time = 1:(n()))
df <- ungroup(df)
```
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.