簡體   English   中英

使用dplyr計算,每列中NA的百分比

[英]Calculate using dplyr, percentage of NA'S in each column

我有一個數據框,其中一些列缺少值。 有沒有辦法(使用 dplyr)有效地計算每列丟失的百分比,即 NA。 尋求像 colSum 等價物。 所以我不必單獨計算每列丟失的百分比?

首先,我為您創建了一個測試數據:

a<- c(1,NA,NA,4)
b<- c(NA,2,3,4)
x<- data.frame(a,b)
x
#    a  b
# 1  1 NA
# 2 NA  2
# 3 NA  3
# 4  4  4

然后你可以使用colMeans(is.na(x))

colMeans(is.na(x))
#    a    b 
# 0.50 0.25 

我們可以使用summarise_each

 library(dplyr)
 x %>% 
   summarise_each(funs(100*mean(is.na(.))))

喜歡這種簡潔的purrr::map類型:

x %>% map(~ mean(is.na(.)))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM