簡體   English   中英

survfit() 為區間刪失數據生成的難以置信的寬置信區間

[英]Implausibly wide confidence intervals produced by survfit() for interval censored data

我有通過間歇性訪談生成的數據,在訪談中詢問個人是否正在經歷某種症狀。 最后一次已知每個人沒有這種特定症狀的時間表示為tstart 如果適用,觀察到個體出現症狀的時間是tstop 使用R中的survival package,用Surv function創建一個survival object,指定這是區間截尾數據。 我想要生存 function 的非參數最大似然估計。這可以使用survfit function 來完成,它似乎將調用傳遞給內部 function survfitTurnbull 由此產生的置信區間寬得令人難以置信。 我無法弄清楚為什么會這樣。

# A random sample of the data using dput()
structure(list(tstart = c(0.01, 38, 0.01, 0.01, 23, 26, 0.01, 
19, 0.01, 0.01, 22, 6, 0.01, 14, 16, 0.01, 0.01, 0.01, 0.01, 
21, 15, 0.01, 0.01, 13, 10, 0.01, 0.01, 19, 0.01, 0.01, 0.01, 
0.01, 22, 17, 27, 14, 16, 0.01, 20, 27, 10, 0.01, 0.01, 16, 20, 
7, 6, 15, 0.01, 0.01), tstop = c(4.01, NA, 5.01, 8.01, NA, NA, 
5.01, NA, 3.01, 16.01, NA, 6.01, 8.01, NA, NA, 7.01, 16.01, 1.01, 
10.01, NA, NA, 5.01, 8.01, NA, NA, 2.01, 3.01, NA, 7.01, 5.01, 
2.01, 9.01, NA, NA, NA, NA, NA, 10.01, NA, NA, NA, 5.01, 10.01, 
NA, NA, NA, 7.01, NA, 14.01, 4.01)), row.names = c(NA, -50L), class = "data.frame")

survObj <- with(temp_df, Surv(time = tstart, time2 = tstop, type = "interval2"))
survFit <- survfit(SurvObj ~ 1))
summary(survFit)

置信區間不會隨時間縮小。 使用整個數據集(包含大約 10 倍的事件數)並沒有縮小范圍。 我無法弄清楚出了什么問題。

對於它的價值,這看起來不像是軟件中的錯誤,而是使用像非參數最大似然估計器(NPMLE,也稱為 Turnbull 估計器, survfit適合如果你給它區間截尾數據)來估計生存曲線。 這個答案的 TLDR 版本是我建議您使用參數 model,例如 Weibull,使用survival::survregicenReg::ic_paricenReg::ic_bayes 承認偏見:我是 icenReg 的作者。

關於 NPMLE 的一個有點技術性但非常相關的說明是它只將正概率質量分配給 Turnbull 區間,這些區間定義為區間的左側是某個觀察區間的左側,而 Turnbull 區間的右側是任何觀察區間的下一個最近的右側。 為了說明,我繪制了您的觀察間隔和相應的 Turnbull 間隔。

在此處輸入圖像描述

請注意,最后兩個 Turnbull 間隔之間存在巨大差距,這會導致非常“跳躍”的 NPMLE。 這也會導致跳躍之間出現相當多的錯誤。

在花了很長時間思考這個問題之后,我的快速總結是,這是只有少量信息數據和太多靈活性的結果。 在大多數生存分析案例中,假設一條平滑的生存曲線(例如參數分布)是合理的。 只要分布不是過於嚴格(閱讀:單參數指數分布),這種溫和的平滑假設允許您從數據中獲得更多信息,而不會引入太多偏差。

為了說明,我附上了威布爾擬合 + 置信區間的 plot 和它旁邊的擬合 NPMLE。

在此處輸入圖像描述

僅供參考,您在 NPMLE 中看到的框不是置信區間,而是 NPMLE 僅在分配給每個 Turnbull 區間的概率內是唯一的,但概率在區間內的分布方式不會影響對數似然. 因此,任何通過該框的生存曲線都會使對數似然最大化。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM