簡體   English   中英

如何使用“missForest”按因子水平估算值?

[英]How do I impute values by factor levels using 'missForest'?

我正在嘗試使用 missForest 中可用的非參數方法來估算我的missForest中的缺失值。 我的數據( OneDrive 鏈接)由一個分類變量和五個連續變量組成。

head(data)
               phylo     sv1 sv2      sv3 sv4 sv5
1 Phaon_camerunensis 6.03803  NA 5121.257  NA  70
2   Umma_longistigma 6.03803  NA 5121.257  NA  53
3   Umma_longistigma 6.03803  NA 5121.257  NA  64
4   Umma_longistigma 6.03803  NA 5121.257  NA  63
5      Sapho_ciliata 6.03803  NA 5121.257  NA  63
6     Sapho_gloriosa 6.03803  NA 5121.257  NA  63

我首先使用missForest()成功了

imp<- missForest(data[2:6])

但是,我不想聚合整個數據矩陣(或 vector?idk exactly),而是想通過phylo來估算缺失值。

我嘗試data[2:6] %>% group_by(phylo) %>%sapply(split(data[2:6], data$phylo)) %>%但沒有成功。

關於如何處理它的任何猜測?

如果你想為每個組運行missForest ,你可以使用group_map

imp <- df %>% group_by(phylo) %>% group_map(~ missForest(.))

要僅從結果中獲取第一項:

imp2 <- t(sapply(imp, "[[", 1))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM