Select 第一个非 NA 值使用 R

Question

df<-data.frame(ID = c(1,1,1,2,3,3,3),
          test = c(NA, 5.5, 6.4, NA, 7.3, NA, 10.9))

I want to create a variable called "value", which is the first non-NA value for the test for each individual ID.我想创建一个名为“value”的变量，它是每个单独 ID 的测试的第一个非 NA 值。 For individual ID 2 who only has the NA, the value is NA.对于只有 NA 的个人 ID 2，该值为 NA。

The expected output is:预期的 output 为：

df<-data.frame(ID = c(1,1,1,2,3,3,3),
           test = c(NA, 5.5, 6.4, NA, 7.3, NA, 10.9),
           value = c(5.5, 5.5, 5.5, NA, 7.3, 7.3, 7.3))

Answer 1

We can use first on the non-NA elements after grouping我们可以在分组后first在非 NA 元素上使用

library(dplyr)
df <- df %>%
    group_by(ID) %>% 
    mutate(value = first(test[complete.cases(test)]))

Answer 2

You can use ave to group by ID and which.max to select with [ the first non NA value.您可以使用ave按ID和which.max到 select 与[第一个非NA值。

df$value <- ave(df$test, df$ID, FUN=function(x) x[which.max(!is.na(x))])
df
#  ID test value
#1  1   NA   5.5
#2  1  5.5   5.5
#3  1  6.4   5.5
#4  2   NA    NA
#5  3  7.3   7.3
#6  3   NA   7.3
#7  3 10.9   7.3

Answer 3

Here is a data.table option using first + na.omit这是使用first + na.omit的data.table选项

> setDT(df)[, value := first(na.omit(test)), ID][]
   ID test value
1:  1   NA   5.5
2:  1  5.5   5.5
3:  1  6.4   5.5
4:  2   NA    NA
5:  3  7.3   7.3
6:  3   NA   7.3
7:  3 10.9   7.3

Select 第一个非 NA 值使用 R

问题描述

3 个解决方案

解决方案1
3 已采纳 2021-01-12 13:58:14

解决方案2
3 2021-01-12 14:09:55

解决方案3
1 2021-01-12 14:20:53

Select 第一个非 NA 值使用 R

问题描述

3 个解决方案

解决方案1 3 已采纳 2021-01-12 13:58:14

解决方案2 3 2021-01-12 14:09:55

解决方案3 1 2021-01-12 14:20:53

解决方案1
3 已采纳 2021-01-12 13:58:14

解决方案2
3 2021-01-12 14:09:55

解决方案3
1 2021-01-12 14:20:53