[英]How do I impute values by factor levels using 'missForest'?
我正在嘗試使用 missForest 中可用的非參數方法來估算我的missForest
中的缺失值。 我的數據( OneDrive 鏈接)由一個分類變量和五個連續變量組成。
head(data)
phylo sv1 sv2 sv3 sv4 sv5
1 Phaon_camerunensis 6.03803 NA 5121.257 NA 70
2 Umma_longistigma 6.03803 NA 5121.257 NA 53
3 Umma_longistigma 6.03803 NA 5121.257 NA 64
4 Umma_longistigma 6.03803 NA 5121.257 NA 63
5 Sapho_ciliata 6.03803 NA 5121.257 NA 63
6 Sapho_gloriosa 6.03803 NA 5121.257 NA 63
我首先使用missForest()
成功了
imp<- missForest(data[2:6])
但是,我不想聚合整個數據矩陣(或 vector?idk exactly),而是想通過phylo
來估算缺失值。
我嘗試data[2:6] %>% group_by(phylo) %>%
和sapply(split(data[2:6], data$phylo)) %>%
但沒有成功。
關於如何處理它的任何猜測?
如果你想為每個組運行missForest
,你可以使用group_map
:
imp <- df %>% group_by(phylo) %>% group_map(~ missForest(.))
要僅從結果中獲取第一項:
imp2 <- t(sapply(imp, "[[", 1))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.