簡體   English   中英

python中的縱向數據分析

[英]Longitudinal data analysis in python

我有結構如下的數據(一個虛構的例子):數據

有 3 個預測變量和 1 個響應變量。 我們有 5 個學生的數據,每個學生對時間 1、2、3 有 3 個觀察值。 因此,觀察總數為 15。

但是我不知道如何分析這種縱向數據中X1,X2,X3對Y的影響。(我將使用python)

誰能給我一些想法?

謝謝你。

由於您有縱向數據和連續響應,因此您有幾個不同的選擇:

  1. 忽略分組結構。 我不建議這樣做,因為您可能會忽略信息。
  2. Model 您的組分開。 這通常不是一個好主意,而且絕對不是在樣本量較小的組的情況下。
  3. 將您的分組變量視為分類預測變量。 當組的數量很高時,這可能又不是理想的,即使最近的提升包可以很好地處理具有高基數的分類預測器(例如CatBoost )。
  4. 使用混合效果 model。

如果您想繼續使用第 4 點,我建議您先查看Gaussian Process Boosting 或 GPBoost package 但是,還有其他 Python 包需要考慮: Statsmodels中的 MERF 和LMER

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM