[英]Special use of colSums(), na.rm = TRUE only if 1 or fewer are missing
我需要总结的一些列的data.frame与说的规则,一列是求和以NA
如果超过一个观察缺少NA
如果只有1或更低失踪了,无论是要进行求和。
说我有一些这样的数据,
dfn <- data.frame(
a = c(3, 3, 0, 3),
b = c(1, NA, 0, NA),
c = c(0, 3, NA, 1))
dfn
a b c
1 3 1 0
2 3 NA 3
3 0 0 NA
4 3 NA 1
然后我应用我的规则,并对缺失的NA
少于2的列求和。 所以我得到这样的东西。
a b c
1 3 1 0
2 3 NA 3
3 0 0 NA
4 3 NA 1
5 9 NA 4
我玩过colSums(dfn, na.rm = FALSE)
和colSums(dfn, na.rm = TRUE)
。 在我的真实数据中,多于三列,多于4行。 我想我可以以某种方式计算失踪人数并将其用作规则?
我不认为您可以单独使用colSums
来做到这colSums
,但是可以使用ifelse
来添加其结果:
colSums(dfn,na.rm=TRUE) + ifelse(colSums(is.na(dfn)) > 1, NA, 0)
a b c
9 NA 4
@James'Answer没问题,但是这是一种更简洁的方法:
colSums(apply(dfn, 2, function(col) replace(col, match(NA, col), 0)))
# a b c
# 9 NA 4
match(NA, col)
返回match(NA, col)
中第一个NA
的索引, replace
将其替换为0
并返回新列, apply
返回包含所有新列的matrix
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.