更新經驗累積函數

Question

我有以下問題：

給定觀察流，找出小於或等於當前最后一次觀察的觀測數。 例如，如果流式觀察是

8,1,10,3,9,7,4,5,6,2

然后我們有以下更新

觀察 - 8，有1個觀察值小於或等於8
觀察 - 8,1，有1個觀察值小於或等於1
觀察--8,1,10，有3次觀察少於或等於10
...

結果，人們將獲得這樣的價值

1,1,3,2,4,3,3,4,5,2

當我使用龐大的數據集時，解決方案應該非常快。

Answer 1

使用for但反方向，我不測試，但我認為它更快。

xx <- c(8, 1, 10, 3, 9, 7, 4, 5, 6, 2)
res = vector('integer',length=length(xx))
for (i in rev(seq_along(xx))) {
  res[i] <- sum(xx[i]>=xx)
  xx <- xx[-i]
}
res
[1] 1 1 3 2 4 3 3 4 5 2

Answer 2

你可以使用sapply ：

vec <- c(8, 1, 10, 3, 9, 7, 4, 5, 6, 2)

sapply(seq_along(vec), function(x) sum(vec[seq(x)] <= vec[x]))
# [1] 1 1 3 2 4 3 3 4 5 2

由於性能很重要，您也可以使用vapply 。 它可能更快（未經測試）：

vapply(seq_along(vec), function(x) sum(vec[seq(x)] <= vec[x]), integer(1))
# [1] 1 1 3 2 4 3 3 4 5 2

Answer 3

所以我不能單獨留下，所以我創造了一個kludgemonster

   carl<-function(vec) {
newct<-vector('integer',length=length(vec))
vlen<-length(vec)
for(j in 1:length(vec) ) {
    wins<- (which(vec[j:vlen] >= vec[j])+j-1)
    newct[wins]<-newct[wins]+1
}
}

它似乎工作，但......

Rgames> set.seed(20)
Rgames> vec<-runif(2000)



 Rgames> microbenchmark(carl(vec),agstudy(vec),times=10)
Unit: milliseconds
         expr      min       lq   median       uq      max neval
    carl(vec) 86.75314 87.55323 88.16816 88.80831 89.65117    10
 agstudy(vec) 70.26213 70.83771 71.06158 71.72247 71.93800    1

仍然不如agstudy的代碼那么好。 也許有人可以收緊我的循環？

更新經驗累積函數

問題描述

3 個解決方案

解決方案1
2 已采納 2014-02-19 13:06:30

解決方案2
1 2014-02-19 12:18:16

解決方案3
0 2014-02-19 20:49:23

更新經驗累積函數

問題描述

3 個解決方案

解決方案1 2 已采納 2014-02-19 13:06:30

解決方案2 1 2014-02-19 12:18:16

解決方案3 0 2014-02-19 20:49:23

解決方案1
2 已采納 2014-02-19 13:06:30

解決方案2
1 2014-02-19 12:18:16

解決方案3
0 2014-02-19 20:49:23