如何僅保留 R 中某些列中具有最高值的行

Question

我有一個看起來像這樣的 dataframe：

library(tidyverse)

df <- tribble (
  ~Species, ~North, ~South, ~East, ~West,
  "a", 4, 3, 2, 3,
  "b", 2, 3, 4, 5, 
  "C", 2, 3, 3, 3,
  "D", 3, 2, 2, 2
)

我想過濾出最高值是北方的物種。 在這種情況下，將選擇物種 A 和 D。 預期的 output 將是一個 df，其中只有物種 A 和 D。 我使用了這樣的解決方法：

df %>%
group_by(species) %>%
mutate(rowmean = mean(North:West) %>%
filter(North > rowmean) %>%
ungroup() %>%
select(!rowmean)

這似乎是一個簡單任務的很多代碼。 但是，我無法找到一種對代碼更友好的方法？ 是否有（最好是 tidyverse）以更干凈的方式執行此任務的方法？

親切的問候

Answer 1

一種更簡單的方法是在base R max.col Select 數字列。 獲取值為max的每一行的列索引。 檢查是否等於 1 即第一列（因為我們僅從第二列開始選擇）並將行subset

subset(df, max.col(df[-1], 'first') == 1)
# A tibble: 2 x 5
#  Species North South  East  West
#  <chr>   <dbl> <dbl> <dbl> <dbl>
#1 a           4     3     2     3
#2 D           3     2     2     2

如果它基於行均值

subset(df, North > rowMeans(df[-1]))

或者，如果我們更喜歡使用dplyr

library(dplyr)
df %>%
   filter(max.col(cur_data()[-1], 'first') == 1)

同樣，如果它基於行均值

df %>% 
    filter(North > rowMeans(cur_data()[-1]))

Answer 2

# base
df[df$North > rowMeans(df[-1]), ]  
# A tibble: 2 x 5
  Species North South  East  West
  <chr>   <dbl> <dbl> <dbl> <dbl>
1 a           4     3     2     3
2 D           3     2     2     2

如何僅保留 R 中某些列中具有最高值的行

問題描述

2 個解決方案

解決方案1
3 已采納 2021-04-25 18:31:02

解決方案2
2 2021-04-25 18:44:33

如何僅保留 R 中某些列中具有最高值的行

問題描述

2 個解決方案

解決方案1 3 已采納 2021-04-25 18:31:02

解決方案2 2 2021-04-25 18:44:33

解決方案1
3 已采納 2021-04-25 18:31:02

解決方案2
2 2021-04-25 18:44:33