[英]How do I create a summary statistic for multiple years and variables?
R 新手在這里。 我正在做一個項目,我需要將多年的數據組合成每列的單個匯總統計數據。 例如,我有 5 年的數據需要平均,其中有幾列用於不同的變量。 現代潛水作品中提供的例子:
summary_monthly_temp <- weather %>%
group_by(month) %>%
summarize(mean = mean(temp, na.rm = TRUE),
std_dev = sd(temp, na.rm = TRUE)
)
summary_monthly_temp
然后我修改它以滿足我的需要:
summarysummary<- filename%>%
group_by(country) %>%
summarize(mean = mean(gdp, na.rm = TRUE),
std_dev = sd(gdp, na.rm = TRUE)
)
但在總結 function 中,我需要總結更多變量,例如人口(獲取平均人口)和總 gdp。
做這個的最好方式是什么?
我嘗試了這樣的事情,但它不起作用:
summary<- filename%>%
group_by(country) %>%
summarize(mean = mean(gdp, na.rm = TRUE),
std_dev = sd(gdp, na.rm = TRUE))%>%
summarize(mean = mean(pop, na.rm = TRUE),
std_dev = sd(pop, na.rm = TRUE))%>%
我想我知道為什么......將一個 function 連接到另一個......
感謝您的輸入!
首先,您通常不需要在應用匯總 function 后保存數據,因為它的主要用途是在控制台上生成數據匯總為 output。
現在查看您的代碼,我發現了一個問題:
filename %>%
group_by(country) %>%
summarize(
mean = mean(gdp, na.rm = TRUE),
std_dev = sd(gdp, na.rm = TRUE)
)
問題似乎是名為“文件名”的 object,您需要在工作區中將其顯式導入為 R object。 本指南應該可以幫助您從本地文件導入數據: https://github.com/rstudio/cheatsheets/raw/master/data-import.pdf
現在關於 summarise 的使用,如您的示例所示,您可以有多個輸出,假設您的 dataframe 有一個名為“pop”的變量:
actually_a_dataframe%>%
group_by(country) %>%
summarize(
mean_gdp = mean(gdp, na.rm = TRUE),
std_dev_gdp = sd(gdp, na.rm = TRUE),
mean_pop = mean(pop, na.rm = TRUE),
std_dev_pop = sd(pop, na.rm = TRUE)
)
這將為每個國家/地區的 gdp 和 pop 生成平均值和標准。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.