删除组中的NA值

Question

这是我的示例：

mydf <- data.frame('col_1'=c('A','A','B','B','C','C','D','D'), 'col_2'=c(100,NA,90,30,50,60,10,NA))

      col_1 col_2
  1     A   100
  2     A    NA
  3     B    90
  4     B    30
  5     C    50
  6     C    60
  7     D    10
  8     D    NA

我想删除按col_1分组的NA值，以产生以下结果。

      col_1 col_2
  1     B    90
  2     B    30
  3     C    50
  4     C    60

我该怎么做？

Answer 1

我们可以按“ col_1”分组，然后filter没有“ NA”的“ col_2”

library(dplyr)
mydf %>% 
   group_by(col_1) %>%
   filter(!any(is.na(col_2)))

或all

mydf %>%
   group_by(col_1) %>%
   filter(all(!is.na(col_2)))

或者这可以用base R完成

subset(mydf, col_1 %in% names(which(!rowsum(+(is.na(col_2)),
              group = col_1)[,1])))

删除组中的NA值

问题描述

1 个解决方案

解决方案1
0 已采纳 2018-05-05 15:51:54

删除组中的NA值

问题描述

1 个解决方案

解决方案1 0 已采纳 2018-05-05 15:51:54

解决方案1
0 已采纳 2018-05-05 15:51:54