在 R 中分组时从多列数据透视表

Question

我正在努力使用 R 中的 pivot_longer 将宽数据集转换为长数据集。对于下面的示例，我将每个物种的数据作为一列捕获。 我想输出一个数据框，其中第一列是物种，每一行是一个数据点，年份和国家也是列。 我想稍后对这些进行分组和平均，以便我可以绘制它们。 有谁知道如何使用 pivot_longer 实现这一目标？

 Data <- data.frame(
 Country = c("a", "a", "c", "c", "a", "b"),
 Year = c("1990", "1990", "1991", "1992", "1990", "1990"),
 Tiger_Shark = c(0,1,4,7,5,6)  ,
 Whale_shark = c(0, 20, 14, 19, 2,7),
 White_shark = c(0, 0, 12, 29, 1,8))

我尝试了以下方法：

data %>% 
pivot_longer( cols= Tiger_Shark:White_shark,  
          names_to = c(" Tiger", "Whale", "White"),
          values_to = "catch")

但这不会保留我想保留的 Year 或 Country 列。 我认为解决方案很简单，但我对pivot_longer 不熟悉。 非常感谢！！

Answer 1

如果我们想使用ggplot ，请重塑为“长”格式，然后进行绘图。 可以在分组后的summary内进行summarise ，然后进行整形

library(dplyr)
library(tidyr)
library(ggplot2)
Data %>%
   group_by(Year, Country) %>% 
   summarise(across(everything(), mean)) %>%
   pivot_longer(cols = Tiger_Shark:White_shark) %>%
   ggplot(aes(x = Country, y = value, fill = Year)) + 
     geom_col()

或者先重塑为“长”格式，然后通过汇总进行分组

Data %>% 
 pivot_longer(cols = Tiger_Shark:White_shark) %>%
 group_by(Country, Year) %>% 
 summarise(value = mean(value))

names_to在这里应该是单个元素，因为这些列似乎属于一个组

在 R 中分组时从多列数据透视表

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-09-10 19:23:32

在 R 中分组时从多列数据透视表

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-09-10 19:23:32

解决方案1
1 已采纳 2020-09-10 19:23:32