繁体   English   中英

鼠标中的R模拟和回归()

[英]R simulations and regression in mice()

我正在R中使用mouses包进行多次插补,并试图了解其背后的算法。

根据其文档http://www.jstatsoft.org/v45/i03/paper ,据说使用了MICE算法。 据我了解,它使用Gibbs Sampler执行MCMC,其中模拟参数BETA,该参数定义给定Y(所有其他没有Y的变量)的Y(具有缺失值的变量)的条件分布。 利用模拟的BETA,定义了相应的条件分布。 然后,它从条件分布中提取值并用条件分布替换缺失值。 它将对所有缺少值的变量重复该过程。

但是,我不明白的是,回归发生在哪里? 在mice()函数中,我们确实需要指定“ method”参数。 例如,“ logreg”表示二项式分布变量,“ polyreg”表示大于2级的因子变量。 如果插补由MCMC完成,为什么我们需要指定回归?

一些文档表明,MICE算法在所有缺少模式的变量上迭代运行回归。 在每种情况下,缺失的一个变量是响应变量,而其他所有都是解释性变量。 然后,将使用拟合值来替换缺少的值,并继续到缺少的下一个变量。 下一次回归将包括来自上次回归的估算数据。 这与Gibbs采样器相同,但是似乎没有仿真。 详细信息在这里http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3074241/

谁能帮助我了解R中的老鼠实际上发生了什么?

对于每个缺少数据的变量(Y1,...,Yj,... Yk),MICE算法都对所有其他变量(Yj-或子集therof)进行统计模型拟合。 统计模型的类型用method表示。 这就是“回归”。 给定Yj-,拟合模型用于绘制Yj缺失部分的替换物。 之后,算法将继续处理包含缺失值的下一个变量。

一旦所有变量都已填满,算法就会重新开始。

请注意,在拟合模型时,MICE算法会将Yj的观测部分回归 Yj-的观测部分估算部分上。 换句话说,在每次迭代中,回归模型都以一组不同的预测值作为条件(因此通常需要一个以上的迭代)。 这与MI的其他实现略有不同。

还要注意,MICE算法并不是正式的Gibbs采样器(请参见Carpenter和Kenward,2013年写得很好的讨论)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM