繁体   English   中英

python中的纵向数据分析

[英]Longitudinal data analysis in python

我有结构如下的数据(一个虚构的例子):数据

有 3 个预测变量和 1 个响应变量。 我们有 5 个学生的数据,每个学生对时间 1、2、3 有 3 个观察值。 因此,观察总数为 15。

但是我不知道如何分析这种纵向数据中X1,X2,X3对Y的影响。(我将使用python)

谁能给我一些想法?

谢谢你。

由于您有纵向数据和连续响应,因此您有几个不同的选择:

  1. 忽略分组结构。 我不建议这样做,因为您可能会忽略信息。
  2. Model 您的组分开。 这通常不是一个好主意,而且绝对不是在样本量较小的组的情况下。
  3. 将您的分组变量视为分类预测变量。 当组的数量很高时,这可能又不是理想的,即使最近的提升包可以很好地处理具有高基数的分类预测器(例如CatBoost )。
  4. 使用混合效果 model。

如果您想继续使用第 4 点,我建议您先查看Gaussian Process Boosting 或 GPBoost package 但是,还有其他 Python 包需要考虑: Statsmodels中的 MERF 和LMER

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM