簡體   English   中英

在 R 中按條件值過濾

[英]Filtering by conditional values in R

因此,我的數據采用以下一般形式:

library(tidyverse)

id <- c(1, 1, 2, 2, 3, 3)
group <- c("A", "B", "A", "A", "B", "B")
value <- c(34, 12, 56, 78, 90, 91)

df <- tibble(id, group, value)
df

     id group value
  <dbl> <chr> <dbl>
1     1 A        34
2     1 B        12
3     2 A        56
4     2 A        78
5     3 B        90
6     3 B        91

我想要做的可以描述為“對於每個id,取A組的最大值。但是,如果A不在,則取B組的最大值。” 所以我想要的輸出看起來像:

     id group value
  <dbl> <chr> <dbl>
1     1 A        34
4     2 A        78
6     3 B        91

我嘗試使用代碼來做到這一點......

desired <- df %>%
  group_by(id) %>%
  filter(if (exists(group == "A")) max(value) else if (exists(group == "B")) (max(value)))

...但我收到一個錯誤。 幫助?

一種選擇可能是:

df %>%
 group_by(id) %>%
 arrange(group, desc(value), .by_group = TRUE) %>%
 slice(which.max(group == "A"))

     id group value
  <dbl> <chr> <dbl>
1     1 A        34
2     2 A        78
3     3 B        91

這是一個基本的 R 選項

subset(
  df[order(id, group, -value), ],
  ave(rep(TRUE, nrow(df)), id, FUN = function(x) seq_along(x) == 1)
)

這使

     id group value
  <dbl> <chr> <dbl>
1     1 A        34
2     2 A        78
3     3 B        91

基本思想是:

  • 我們通過df[order(id, group, -value), ]df的行重新排序
  • 然后我們根據id取重新排序的df的第一個value

使用數據data.table

library(data.table)
setDT(df)[order(id, group, -value), .SD[1], id]
#    id group value
#1:  1     A    34
#2:  2     A    78
#3:  3     B    91

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM