从具有特定条件的 dataframe 获取不同的行

Question

I have a dataframe:我有一个 dataframe：

ID    Name    Value 
1     John    17
1             17
2             NULL
3             NULL
4    Mike     35
4    Mike     NULL  
5    Leo      22
5    Leo

I want there be only rows with unique ID.我希望只有具有唯一 ID 的行。 I need to keep those rows with maximally full columns.我需要保留这些行的最大完整列。 So, desired result is:所以，想要的结果是：

ID    Name    Value 
1     John    17
2             NULL
3             NULL
4    Mike     35
5    Leo      22

As you see, all ID are kept, but now there are only hose with maximally full columns.如您所见，所有 ID 都保留了下来，但现在只有具有最大满列的软管。 How could i do that?我怎么能那样做？

I tried df[complete_cases(df),], but it removed fully empty rows (ID 2 and 3)我尝试了 df[complete_cases(df),]，但它删除了完全空的行（ID 2 和 3）

Answer 1

I would use dplyr::distinct() in a pipe like that:我会像这样在 pipe 中使用dplyr::distinct() ：

df %>% distinct(ID, .keep_all = TRUE) (.keep_all = TRUE to keep other columns) df %>% distinct(ID, .keep_all = TRUE) （.keep_all = TRUE 保留其他列）

or in base R或在基地 R

df[,duplicated(df$ID),]

both would do the job两者都会做的工作

Answer 2

Using aggregate with option na.action=na.pass .使用带有选项na.action=na.pass的aggregate 。

aggregate(cbind(Value, Name) ~ ID, dat, el, na.action=na.pass)
#   ID Value Name
# 1  1    17 John
# 2  2  NULL <NA>
# 3  3  NULL <NA>
# 4  4    35 Mike
# 5  5    22  Leo

Data:数据：

dat <- structure(list(ID = c(1L, 1L, 2L, 3L, 4L, 4L, 5L, 5L), Name = c("John", 
NA, NA, NA, "Mike", "Mike", "Leo", "Leo"), Value = c("17", "17", 
"NULL", "NULL", "35", NA, "22", "NULL")), class = "data.frame", row.names = c(NA, 
-8L))

从具有特定条件的 dataframe 获取不同的行

问题描述

2 个解决方案

解决方案1
1 2020-09-21 14:17:21

解决方案2
0 2020-09-21 13:18:01

从具有特定条件的 dataframe 获取不同的行

问题描述

2 个解决方案

解决方案1 1 2020-09-21 14:17:21

解决方案2 0 2020-09-21 13:18:01

解决方案1
1 2020-09-21 14:17:21

解决方案2
0 2020-09-21 13:18:01