求和忽略重置的NA

Question

我有條件總和，重置為零。

criteria1 <- c(rep(0,2), rep(1,5), rep(0,3), rep(1,6),rep(0,2))
criteria1[c(6,9,12,13,14,15)] <- NA

#cumsum function, working before the first NA
ave(criteria1, cumsum(criteria1 == 0), FUN = cumsum )
[1]  0  0  1  1  1 NA  1  0 NA  0  1 NA NA NA NA  1  0  0

#and desired output would be
#NA's are replaced with the last value accumulated
#if more than three leave NA's in 
0 0 1 2 3 3 4 0 0 0 1 NA NA NA NA 2 0 0

一些條件：

NA不能用零（或一）代替，
向量必須保持相同的長度（因此排除不是一個選擇）
連續被忽略的NA的最長長度應為3。 如果大於三個，則它們應保留為NA並且功能應從最后一個非NA繼續。

關於同一主題存在一些答案，但是我不確定如何將它們放在一起。
謝謝

Answer 1

使用R base可以做到：生成數據

criteria1 <- c(rep(0,2), rep(1,5), rep(0,3), rep(1,6),rep(0,2))
criteria1[c(6,9,12,13)] <- NA

得到結果

l <- length(criteria1)
cum <- cumsum(ifelse(!is.na(criteria1),criteria1,0))
zero <- which(criteria1 == 0)

res <- cum - rep(cum[zero], c(zero[2:length(zero)],l+1)-zero)

可選的dplyr解決方案：

res <- cum - rep(cum[zero], dplyr::coalesce(dplyr::lead(zero),l+1L)-zero)

檢測並更改NA> 3次的重復

NAs <- rle(is.na(criteria1))
NAloc <- which(NAs$lengths > 3 & NAs$values == 1)
for(i in NAloc)
{
res[seq(sum(NAs$lengths[1:(i-1)])+1,sum(NAs$lengths[1:i]))] <- NA
}

Answer 2

由於NA的總和被視為零，但它們的分組就好像它們具有與先前值相同的值，因此您可以基於ave value變量和group變量中的邏輯來區別對待NA ：

library(data.table); library(dplyr); library(zoo);

ave(coalesce(criteria1, 0), rleid(na.locf(criteria1 != 0)), FUN = cumsum)
# [1] 0 0 1 2 3 3 4 0 0 0 1 1 1 2 3 4 0 0

求和忽略重置的NA

問題描述

2 個解決方案

解決方案1
4 已采納 2017-02-09 14:47:59

解決方案2
2 2017-02-09 14:47:32

求和忽略重置的NA

問題描述

2 個解決方案

解決方案1 4 已采納 2017-02-09 14:47:59

解決方案2 2 2017-02-09 14:47:32

解決方案1
4 已采納 2017-02-09 14:47:59

解決方案2
2 2017-02-09 14:47:32