使用 group_by 對除具有特定條件的行之外的所有行進行子集，以用於 r 中的不同數量的變量

Question

我想過濾這個df

Sample <- c(1:24)
Group <- c("A","A","A","A","A","A","A","A","A","A","A","A", "B","B","B","B","B","B","B","B","B","B","B","B")
T1 <- c(74.4, 74.7, 74.1, 72.2, 72.8, 72.9, 70.8, 71.2, 70.5, 72.4, 72.7, 72.1, 71.2, 71.8, 71.9, 70.8, 70.2, 70.5, 72.2, 72.7, 72.1, 70.8, 71.0, 70.7)
S1 <- c("sample", "sample", "sample", "std", "std","std","std","std", "std", "sample", "sample", "sample","sample", "sample", "sample", "std", "std","std", "std", "std", "sample", "sample", "sample", "sample")
df <- data.frame(Sample, Group, T1, S1)

保留所有行，除了每個組的S1=="std" & Group == "A" & T1 %!+-1% median(T1[S1 == "std"])以獲得此Group

   Sample Group   T1     S1
1       1     A 74.4 sample
2       2     A 74.7 sample
3       3     A 74.1 sample
4       4     A 72.2    std
7       7     A 70.8    std
8       8     A 71.2    std
10     10     A 72.4 sample
11     11     A 72.7 sample
12     12     A 72.1 sample
13     13     B 71.2 sample
14     14     B 71.8 sample
15     15     B 71.9 sample
16     16     B 70.8    std
17     17     B 70.2    std
18     18     B 70.5    std
21     21     B 72.1 sample
22     22     B 70.8 sample
23     23     B 71.0 sample
24     24     B 70.7 sample
>

我得到了這個漂亮代碼的幫助

df %>% group_by(Group) %>% filter(T1 %+-1% median(T1[S1 == "std"]))

它過濾所有行（不僅是S1 == "std" ），但我無法解決它來實現subset function 以便我刪除具有這些條件的行。

我仍然這樣做 - 據我所知，這不是正確的方式，而且它也不允許我為不同數量的組（如果超過 2 個）這樣做

for(Var in unique(df$Group)) {
    assign(paste("T1_", Var, sep = ""), median(filter(df, Group == Var, S1 == "std")$T1))
  }
`%+-1%` <- function(T1, T1_A) (T1 >= T1_A-1) & (T1 <= T1_A+1)
df  %>% subset(!(df$S1=="std" & df$Group == "A" & df$T1 %!+-1% T1_A | 
                 df$S1=="std" & df$Group == "B" & df$T1 %!+-1% T1_B))

Answer 1

這將刪除每個Group中S1=="std"和Group == "A"且T1值介於S1 == "std"的T1中median的 +- 1% 之間的行。

library(dplyr)

df %>%
  group_by(Group) %>%
  filter({
  val <- median(T1[S1 == "std"])     
  !(S1=="std" & T1 %!+-1% val)
  }) %>% 
  ungroup

使用 group_by 對除具有特定條件的行之外的所有行進行子集，以用於 r 中的不同數量的變量

問題描述

1 個解決方案

解決方案1
1 已采納 2021-06-09 01:21:39

使用 group_by 對除具有特定條件的行之外的所有行進行子集，以用於 r 中的不同數量的變量

問題描述

1 個解決方案

解決方案1 1 已采納 2021-06-09 01:21:39

解決方案1
1 已采納 2021-06-09 01:21:39