我很确定你们都同意rle是R中的那些“陷阱”函数之一。是否有任何类似的函数可以“捕获”相邻整数值的“运行”?

所以,如果我有一个像这样的矢量:

x <- c(3:5, 10:15, 17, 22, 23, 35:40)

我称之为深奥的功能,我会得到这样的响应:

lengths: 3, 6, 1, 2, 6
values: (3,4,5), (10,11,12... # you get the point

编写这样的函数并不难,但仍然......任何想法?

===============>>#1 票数:8 已采纳

1)根据值计算值然后计算长度

s <- split(x, cumsum(c(0, diff(x) != 1)))
run.info <- list(lengths = unname(sapply(s, length)), values = unname(s))

使用问题中的x运行它会给出:

> str(run.info)
List of 2
 $ lengths: int [1:5] 3 6 1 2 6
 $ values :List of 5
  ..$ : num [1:3] 3 4 5
  ..$ : num [1:6] 10 11 12 13 14 15
  ..$ : num 17
  ..$ : num [1:2] 22 23
  ..$ : num [1:6] 35 36 37 38 39 40

2)根据长度计算长度,然后计算值

这是基于Gregor长度计算的第二种解决方案:

lens <- rle(x - seq_along(x))$lengths 
list(lengths = lens, values = unname(split(x, rep(seq_along(lens), lens))))

3)计算长度和值而不使用其他

这个似乎效率低下,因为它从头开始计算每个lengthsvalues ,它似乎有点过于复杂,但它确实设法将它全部归结为一个语句,所以我想我也会添加它。 它基本上只是上面标记为1)和2)的前两个解决方案的混合。 没有什么比这两个更新的了。

list(lengths = rle(x - seq_along(x))$lengths,
           values = unname(split(x, cumsum(c(0, diff(x) != 1)))))

编辑:添加第二个解决方案。

编辑:添加第三个解决方案。

===============>>#2 票数:6

怎么样

rle(x - 1:length(x))$lengths   
# 3 6 1 2 6

长度是你想要的长度,虽然我用一种同样聪明的方式来获得正确的值,但是使用cumsum()和原始的x它们是非常容易接近的。

===============>>#3 票数:5

正如你所说,写一些类似于rle东西很容易。 实际上,通过添加+ 1来调整rle的代码可能会给出类似的结果

rle_consec <- function(x)
{
    if (!is.vector(x) && !is.list(x))
        stop("'x' must be an atomic vector")
    n <- length(x)
    if (n == 0L)
    return(structure(list(lengths = integer(), values = x),
             class = "rle_consec"))
    y <- x[-1L] != x[-n] + 1
    i <- c(which(y | is.na(y)), n)
    structure(list(lengths = diff(c(0L, i)), values = x[i]),
              class = "rle_consec")
}

并使用你的例子

> x <- c(3:5, 10:15, 17, 22, 23, 35:40)
> rle_consec(x)
$lengths
[1] 3 6 1 2 6

$values
[1]  5 15 17 23 40

attr(,"class")
[1] "rle_consec"

这是约翰所期望的。

您可以进一步调整代码,以给出每个连续子序列的第一个而不是最后一个。

===============>>#4 票数:2

我最近在这里发布了我的seqle代码,基于此处发布的代码,甚至是:-)。

您可以在随后的整数序列的检测间隔找到它

  ask by aL3xa translate from so

未解决问题?本站智能推荐: