通過跨多列測試邏輯條件進行過濾

Question

dplyr中是否有允許您針對選定的列測試相同條件的函數？

獲取以下數據框：

Demo1 <- c(8,9,10,11)
Demo2 <- c(13,14,15,16)
Condition <- c('A', 'A', 'B', 'B')
Var1 <- c(13,76,105,64)
Var2 <- c(12,101,23,23)
Var3 <- c(5,5,5,5)

df <- as.data.frame(cbind(Demo1, Demo2, Condition, Var1, Var2, Var3), stringsAsFactors = F)
df[4:6] <- lapply(df[4:6], as.numeric)

我想取出 Var1、Var2 或 Var3 中至少有一個大於 100 的值的所有行。 我意識到我可以用一系列 or 語句來做到這一點，如下所示：

df <- df %>% 
  filter(Var1 > 100 | Var2 > 100 | Var3 > 100)

但是，由於我的實際數據集中有相當多的列，這將非常耗時。 我假設有一些相當簡單的方法可以做到這一點，但一直無法在 SO 上找到解決方案。

Answer 1

我們可以用filter_at和any_vars做到這any_vars

df %>% 
  filter_at(vars(matches("^Var")), any_vars(.> 100))
#   Demo1 Demo2 Condition Var1 Var2 Var3
#1     9    14         A   76  101    5
#2    10    15         B  105   23    5

或者使用base R ，使用lapply和Reduce創建一個邏輯表達式並對行進行子集化

df[Reduce(`|`, lapply(df[grepl("^Var", names(df))], `>`, 100)),]

Answer 2

在base-R可以使用rowSums編寫相同的過濾器：

df[rowSums((df[,grepl("^Var",names(df))] > 100)) >= 1, ]

#   Demo1 Demo2 Condition Var1 Var2 Var3
# 2     9    14         A   76  101    5
# 3    10    15         B  105   23    5

通過跨多列測試邏輯條件進行過濾

問題描述

2 個解決方案

解決方案1
3 已采納 2018-05-24 06:04:36

解決方案2
3 2018-05-24 06:17:33

通過跨多列測試邏輯條件進行過濾

問題描述

2 個解決方案

解決方案1 3 已采納 2018-05-24 06:04:36

解決方案2 3 2018-05-24 06:17:33

解決方案1
3 已采納 2018-05-24 06:04:36

解決方案2
3 2018-05-24 06:17:33