返回連續值滿足條件的行

Question

我有以下數據幀df 。 我想返回一個向量result ，指示哪些行符合以下標准：該行中至少有2個連續值低於-1.7。

set.seed(123)

df <- data.frame(V1=rnorm(10,-1.5,.5),
                 V2=rnorm(10,-1.5,.5),
                 V3=rnorm(10,-1.5,.5),
                 V4=rnorm(10,-1.5,.5),
                 V5=rnorm(10,-1.5,.5),
                 V6=rnorm(10,-1.5,.5),
                 V7=rnorm(10,-1.5,.5),
                 V8=rnorm(10,-1.5,.5),
                 V9=rnorm(10,-1.5,.5),
                 V10=rnorm(10,-1.5,.5))
rownames(df) <- c(seq(1976,1985,1))

結果將是一個向量：

result <- c(1977,1979,1980,1982,1983,1985)

Answer 1

一個選項是使用apply遍歷行，使用rle創建邏輯條件，檢查是否有any lengths大於1的TRUE元素，提取names

names(which(apply(df, 1, function(x) with(rle(x < - 1.7), any(lengths[values] > 1)))))
#[1] "1977" "1979" "1980" "1982" "1983" "1985"

或者更好的方法是通過放置兩個邏輯矩陣來對其進行矢量化（即刪除數據集的第一列，檢查它是否小於-1.7，同樣刪除最后一列並執行相同操作）， Reduce其Reduce為單個邏輯matrix通過檢查相應元素是否為TRUE ，獲取rowSums ，如果值大於0，則提取行名稱

names(which(rowSums(Reduce(`&`, list(df[-ncol(df)] < -1.7, df[-1] < -1.7))) > 0))
#[1] "1977" "1979" "1980" "1982" "1983" "1985"

Answer 2

一個有趣的選項which使用arr.ind = TRUE

temp <- which(df < -1.7, arr.ind = TRUE)
rownames(df)[aggregate(col~row, temp, function(x) any(diff(x) == 1))[, 2]]

#[1] "1977" "1979" "1980" "1982" "1983" "1985"

我們首先獲得值小於-1.7的所有行和列位置。 使用aggregate我們為每一row組合col ，並檢查row是否至少有一個連續值，以及返回其rownames TRUE子集的值。

Answer 3

一種解決方案，它使用滯后和來獲得向量中每對數字的總和。 如果滯后總和為2，則表示該行中至少有2個連續值滿足條件。

rownames(df)[apply(df < -1.7, 1, function(x) any(x[-nrow(df)] + x[-1] == 2))]

# [1] "1977" "1979" "1980" "1982" "1983" "1985"

返回連續值滿足條件的行

問題描述

3 個解決方案

解決方案1
3 已采納 2019-01-10 15:53:00

解決方案2
3 2019-01-10 15:58:54

解決方案3
2 2019-01-10 16:37:21

返回連續值滿足條件的行

問題描述

3 個解決方案

解決方案1 3 已采納 2019-01-10 15:53:00

解決方案2 3 2019-01-10 15:58:54

解決方案3 2 2019-01-10 16:37:21

解決方案1
3 已采納 2019-01-10 15:53:00

解決方案2
3 2019-01-10 15:58:54

解決方案3
2 2019-01-10 16:37:21