R中不存在NA时将最小值或最大值函数应用于数组

Question

我有一个问题看起来很简单，但确实使我发疯。 我真的需要你的帮助。

首先让我们生成一些数据

a<-c(rep(1:2,2),NA,NA)
b<-c(rep(NA,3),3,4,NA)
df<-cbind(a,b)

表格如下：

      a  b
[1,]  1 NA
[2,]  2 NA
[3,]  1 NA
[4,]  2  3
[5,] NA  4
[6,] NA NA

现在，我需要第三列：

当a和b都不为NA时，返回两者中的最大值。
当其中之一不是NA时，返回非NA号
当它们均为NA时，返回NA。

总而言之，我正在寻找这样的结果：

      a  b  c
[1,]  1 NA  1
[2,]  2 NA  2
[3,]  1 NA  1
[4,]  2  3  3
[5,] NA  4  4
[6,] NA NA NA

我试过df$c<-max(df$a,df$b) ，显然这不起作用并给我：

Error in df$a : $ operator is invalid for atomic vectors

有人可以帮我吗？ 非常感谢你！！

Answer 1

您可以在将数据集（“ df”为“矩阵”）转换为“ data.frame”后尝试使用pmax

cbind(df, c=do.call(`pmax`, c(as.data.frame(df), list(na.rm=TRUE))))
#      a  b  c
#[1,]  1 NA  1
#[2,]  2 NA  2
#[3,]  1 NA  1
#[4,]  2  3  3
#[5,] NA  4  4
#[6,] NA NA NA

如果您需要每一行的“最小值”值，请用pmin替换pmax 。 要创建一个“ data.frame”，您可以使用

df <- data.frame(a, b)

cbind将输出作为“矩阵”。 $运算符不适用于'matrix'，因此最好使用[

Answer 2

您还可以使用“常规” max函数：

df <- cbind(df, c = apply(df, 1, function(x) ifelse(all(is.na(x)), NA, max(x, na.rm=T))))

df
#      a  b  c
#[1,]  1 NA  1
#[2,]  2 NA  2
#[3,]  1 NA  1
#[4,]  2  3  3
#[5,] NA  4  4
#[6,] NA NA NA

R中不存在NA时将最小值或最大值函数应用于数组

问题描述

2 个解决方案

解决方案1
1 2015-02-16 15:22:49

解决方案2
1 2015-02-16 15:33:53

R中不存在NA时将最小值或最大值函数应用于数组

问题描述

2 个解决方案

解决方案1 1 2015-02-16 15:22:49

解决方案2 1 2015-02-16 15:33:53

解决方案1
1 2015-02-16 15:22:49

解决方案2
1 2015-02-16 15:33:53