![](/img/trans.png)
[英]R :Fitting survival trees with time-varying covariates in RandomForestSRC
[英]How to present survival data that includes time-varying covariates and fit the model in R
我想使用名為timereg
的R包中的aalen()
函數執行包含時變協變量的生存分析。 但是,我仍然對如何在數據框中顯示數據以及如何指定模型公式感到困惑。
這是一個組成的數據集:
subject_id survival_time weight height outcome_indicator
1 3 65 1.8 0
1 4 68 1.8 0
1 7 70 1.8 1
2 2 55 1.6 0
2 9 53 1.6 0
3 2 62 1.7 0
3 3 65 1.7 0
3 5 64 1.7 0
3 6 66 1.7 0
以下是一些解釋:
subject_id
變量確定,並分別進行3次,2次,4次隨訪。 weight
是一種隨時間變化的協變量。 height
與時間無關,因此對於每個受試者,每次隨訪都保持不變。 survival_time
時間的單位是年,那么感興趣的事件發生在第7年的主題1。 survival_time
進行排序。 最后,我的問題列表(即使你沒有得到所有的答案,或者我的解決方案是正確的,請不要猶豫,發表評論):
aalen
模型(或包含時變協變量的任何其他模型)? 是這樣的: aalen(formula = Survf(survival_time, outcome_indicator) ~ const(height) + weight, data = data_set, id = data_set$subject_id)
其中Survf()
函數用於組合兩個與結果相關的變量; const()
用於表示隨時間變化的協變量,保留其他協變量; data_set
是數據幀的名稱; 和id
參數用於關聯同一主題的不同行?
這可能不是表示這些數據的正確方法。 從變量survival_time
的排序來看,這些是協變量變化的群組時間。 您需要一個滯后的事件時間來指示觀察的“開始”,對於第一個患者記錄設置為0。 現在,您對數據進行格式化的方式已經使分母時間平方,降低了發生率,並將風險比減弱到零。
拿第一個參與者:事實上他們從0到7被觀察。第一個記錄是0到3,下一個:3到4,最后4到7.你在哪里明確告訴R? R不知道這些記錄屬於同一個人。 R現在認為有3人隨后累計3 + 4 + 7 = 14年有1個事件而不是7年有1個事件(發病率從14 ppy到7 ppy)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.