如何在`dplyr`中的`summarise`操作后保留列

Question

我有這種類型的數據：

df <- data.frame(name = c("Acer laurinum", "Acer laurinum Hassk.", "Acmella paniculata", 
                          "Adinandra cf. integerrima", "Adinandra cf. integerrima T.Anderson"),
                 value1 = c(1,2,3,4,5),
                 value2 = c(2,3,4,5,6))

我想根據列name的匹配部分summarise列value1和value2並保留新列author的唯一值。 這段代碼只做了總結部分，但author不見了：

df %>%
  mutate(author = str_extract(name, "(?<=\\s)(?=.*\\.)[.\\w]+$"),
         name1 = trimws(str_remove(name, "(?<=\\s)(?=.*\\.)[.\\w]+$"))) %>%
  group_by(name1) %>%
  summarise(across(c(value1, value2), sum))

# A tibble: 3 x 3
  name1                     value1 value2
* <chr>                      <dbl>  <dbl>
1 Acer laurinum                  3      5
2 Acmella paniculata             3      4
3 Adinandra cf. integerrima      9     11

預期輸出：

# A tibble: 3 x 3
  name1                     value1 value2      author
* <chr>                      <dbl>  <dbl>       <chr>
1 Acer laurinum                  3      5       Hassk.
2 Acmella paniculata             3      4        <NA>
3 Adinandra cf. integerrima      9     11  T.Anderson

Answer 1

您可以使用na.omit(author)[1]獲取組中author第一個非 NA 值。

library(dplyr)
library(stringr)

df %>%
  mutate(author = str_extract(name, "(?<=\\s)(?=.*\\.)[.\\w]+$"),
         name1 = trimws(str_remove(name, "(?<=\\s)(?=.*\\.)[.\\w]+$"))) %>%
  group_by(name1) %>%
  summarise(across(c(value1, value2), sum), 
            author = na.omit(author)[1])

#  name1                     value1 value2 author    
#  <chr>                      <dbl>  <dbl> <chr>     
#1 Acer laurinum                  3      5 Hassk.    
#2 Acmella paniculata             3      4 NA        
#3 Adinandra cf. integerrima      9     11 T.Anderson

如何在`dplyr`中的`summarise`操作后保留列

問題描述

1 個解決方案

解決方案1
1 已采納 2021-10-12 11:46:05

如何在`dplyr`中的`summarise`操作后保留列

問題描述

1 個解決方案

解決方案1 1 已采納 2021-10-12 11:46:05

解決方案1
1 已采納 2021-10-12 11:46:05