在R中的多個列中應用矢量化子集

Question

我試圖找到一種直接的方法來矢量化/概括data.frame的子集化。 我們假設我有一個data.frame：

df <- data.frame(A = 1:5, B = 10 * 1:5, C = 100 * 1:5)

每列都有自己的條件，目標是df的子集，因此只有那些行保留在至少一列滿足條件的位置。 我現在想要找到一個概括的向量化子集機制

df <- subset(df, df[,1]<2 | df[,2]< 30 | df[,3]<100)

所以我可以像這樣制定它

crit <- c(2,30,100)
df <- subset(df, df$header < crit[1:3])

在我想去的路上。

df <- subset(df, df$header < crit[1:n])

我知道一個多步循環解決方法，但必須有另一種方法。 我很感激任何幫助。

Answer 1

鑒於：

x <- c(1:5)
y <- c(10,20,30,40,50)
z <- c(100,200,300,400,500)

# df is a base function
mydf <- data.frame(A = x, B = y, C = z)

crit <- c(2,30,100)

然后，這將讓您看到列中的哪些值小於臨界值：

> sweep(mydf, 2, crit, "<")
         A     B     C
[1,]  TRUE  TRUE FALSE
[2,] FALSE  TRUE FALSE
[3,] FALSE FALSE FALSE
[4,] FALSE FALSE FALSE
[5,] FALSE FALSE FALSE

這將為您提供符合任何條件的行：

> subset(mydf, rowSums(sweep(mydf, 2, crit, "<")) > 0)

  A  B   C
1 1 10 100
2 2 20 200

Answer 2

這也應該有效

> df[apply(df, 1, function(x){any(x < crit)}), ]
  A  B   C
1 1 10 100
2 2 20 200

在R中的多個列中應用矢量化子集

問題描述

2 個解決方案

解決方案1
4 已采納 2016-01-15 22:22:38

解決方案2
1 2016-01-15 22:21:57

在R中的多個列中應用矢量化子集

問題描述

2 個解決方案

解決方案1 4 已采納 2016-01-15 22:22:38

解決方案2 1 2016-01-15 22:21:57

解決方案1
4 已采納 2016-01-15 22:22:38

解決方案2
1 2016-01-15 22:21:57