[英]Pivot table from multiple columns while grouping in R
我正在努力使用 R 中的 pivot_longer 将宽数据集转换为长数据集。对于下面的示例,我将每个物种的数据作为一列捕获。 我想输出一个数据框,其中第一列是物种,每一行是一个数据点,年份和国家也是列。 我想稍后对这些进行分组和平均,以便我可以绘制它们。 有谁知道如何使用 pivot_longer 实现这一目标?
Data <- data.frame(
Country = c("a", "a", "c", "c", "a", "b"),
Year = c("1990", "1990", "1991", "1992", "1990", "1990"),
Tiger_Shark = c(0,1,4,7,5,6) ,
Whale_shark = c(0, 20, 14, 19, 2,7),
White_shark = c(0, 0, 12, 29, 1,8))
我尝试了以下方法:
data %>%
pivot_longer( cols= Tiger_Shark:White_shark,
names_to = c(" Tiger", "Whale", "White"),
values_to = "catch")
但这不会保留我想保留的 Year 或 Country 列。 我认为解决方案很简单,但我对pivot_longer 不熟悉。 非常感谢!!
如果我们想使用ggplot
,请重塑为“长”格式,然后进行绘图。 可以在分组后的summary内进行summarise
,然后进行整形
library(dplyr)
library(tidyr)
library(ggplot2)
Data %>%
group_by(Year, Country) %>%
summarise(across(everything(), mean)) %>%
pivot_longer(cols = Tiger_Shark:White_shark) %>%
ggplot(aes(x = Country, y = value, fill = Year)) +
geom_col()
或者先重塑为“长”格式,然后通过汇总进行分组
Data %>%
pivot_longer(cols = Tiger_Shark:White_shark) %>%
group_by(Country, Year) %>%
summarise(value = mean(value))
names_to
在这里应该是单个元素,因为这些列似乎属于一个组
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.