簡體   English   中英

如何呈現包含時變協變量的生存數據並使模型適合R.

[英]How to present survival data that includes time-varying covariates and fit the model in R

我想使用名為timereg的R包中的aalen()函數執行包含時變協變量的生存分析。 但是,我仍然對如何在數據框中顯示數據以及如何指定模型公式感到困惑。

這是一個組成的數據集:

subject_id survival_time weight height outcome_indicator
1 3 65 1.8 0
1 4 68 1.8 0
1 7 70 1.8 1
2 2 55 1.6 0
2 9 53 1.6 0
3 2 62 1.7 0
3 3 65 1.7 0
3 5 64 1.7 0
3 6 66 1.7 0

以下是一些解釋:

  1. 有3個研究對象,由subject_id變量確定,並分別進行3次,2次,4次隨訪。
  2. weight是一種隨時間變化的協變量。
  3. height與時間無關,因此對於每個受試者,每次隨訪都保持不變。
  4. 假設survival_time時間的單位是年,那么感興趣的事件發生在第7年的主題1。
  5. 主題2和3都是正確的審查案例。
  6. 屬於同一主題的每個跟進都可以通過survival_time進行排序。

最后,我的問題列表(即使你沒有得到所有的答案,或者我的解決方案是正確的,請不要猶豫,發表評論):

  1. 我是否正確提供包含時變協變量的生存數據?
  2. 如果第一個問題的答案是“否”,那么請您指出問題是什么並提供一些解釋?
  3. 假設數據集沒問題,那么如何指定模型公式並擬合aalen模型(或包含時變協變量的任何其他模型)? 是這樣的:

aalen(formula = Survf(survival_time, outcome_indicator) ~ const(height) + weight, data = data_set, id = data_set$subject_id)

其中Survf()函數用於組合兩個與結果相關的變量; const()用於表示隨時間變化的協變量,保留其他協變量; data_set是數據幀的名稱; id參數用於關聯同一主題的不同行?

這可能不是表示這些數據的正確方法。 從變量survival_time的排序來看,這些是協變量變化的群組時間。 您需要一個滯后的事件時間來指示觀察的“開始”,對於第一個患者記錄設置為0。 現在,您對數據進行格式化的方式已經使分母時間平方,降低了發生率,並將風險比減弱到零。

拿第一個參與者:事實上他們從0到7被觀察。第一個記錄是0到3,下一個:3到4,最后4到7.你在哪里明確告訴R? R不知道這些記錄屬於同一個人。 R現在認為有3人隨后累計3 + 4 + 7 = 14年有1個事件而不是7年有1個事件(發病率從14 ppy到7 ppy)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM