在 R 的 MICE 中对每个插补数据集执行操作

Question

我怎样才能执行操作（如子集划分或添加计算的列）的类的对象上的每个数据集估算mids来自R的包mice ？ 我希望结果仍然是一个mids对象。

编辑：示例

library(mice)
data(nhanes)

# create imputed datasets
imput = mice(nhanes)

估算的数据集存储为列表列表

imput$imp

其中只有对给定变量进行插补的观察行。

原始（不完整）数据集存储在这里：

imput$data

例如，我将如何在每个估算数据集中创建一个计算为chl/2的新变量，从而产生一个新的mids对象？

Answer 1

这可以很容易地完成如下 -

使用complete()将 mids 对象转换为长格式 data.frame：

 long1 <- complete(midsobj1, action='long', include=TRUE)

执行任何需要的操作：

 long1$new.var <- long1$chl/2
 long2 <- subset(long1, age >= 5)

使用as.mids()将操纵的数据转换回 mids 对象：

 midsobj2 <- as.mids(long2)

现在您可以根据需要使用midsobj2 。 请注意， as.mids()需要include=TRUE （用于包含具有缺失值的原始数据as.mids()才能正确压缩长格式数据。 请注意，在 mouse v2.25 之前， as.mids() 函数中存在一个错误（请参阅此帖子https://stats.stackexchange.com/a/158327/69413 ）

编辑：根据这个答案https://stackoverflow.com/a/34859264/4269699 （从本质上是一个重复的问题），您还可以通过访问 $data 和 $imp 直接编辑 mids 对象。 所以例如

 midsobj2<-midsobj1
 midsobj2$data$new.var <- midsobj2$data$chl/2
 midsobj2$imp$new.var <- midsobj2$imp$chl/2

但是，如果您想对 $imp 进行子集化或使用 $call，您会遇到麻烦，因此我一般不推荐此解决方案。

Answer 2

另一种选择是在插补之前计算变量并对它们施加限制。

library(mice)

# Create the additional variable - this will have missing
nhanes$extra <- nhanes$chl / 2

# Change the method of imputation for extra, so that it always equals chl/2
# Change the predictor matrix so only chl predicts extra
ini <- mice(nhanes, max = 0, print = FALSE)

meth <- ini$meth
meth["extra"] <- "~I(chl / 2)"

pred <- ini$pred  # extra isn't used to predict
pred["extra", "chl"] <- 1

# Imputations
imput <- mice(nhanes, seed = 1, pred = pred, meth = meth, print = FALSE)

在小鼠中有例子：Multivariate Imputation by Chained Equations in R 。

Answer 3

有大量的with可以帮助你

with(imput, chl/2)

文档位于?with.mids

Answer 4

basecamb包中有一个函数：

library(basecamb)
apply_function_to_imputed_data(mids_object, function)

在 R 的 MICE 中对每个插补数据集执行操作

问题描述

4 个解决方案

解决方案1
11 2015-06-17 12:49:29

解决方案2
4 已采纳 2014-10-31 04:20:53

解决方案3
1 2014-10-31 04:03:39

解决方案4
1 2021-05-09 14:56:14

在 R 的 MICE 中对每个插补数据集执行操作

问题描述

4 个解决方案

解决方案1 11 2015-06-17 12:49:29

解决方案2 4 已采纳 2014-10-31 04:20:53

解决方案3 1 2014-10-31 04:03:39

解决方案4 1 2021-05-09 14:56:14

解决方案1
11 2015-06-17 12:49:29

解决方案2
4 已采纳 2014-10-31 04:20:53

解决方案3
1 2014-10-31 04:03:39

解决方案4
1 2021-05-09 14:56:14