簡體   English   中英

如何創建多年和變量的匯總統計?

[英]How do I create a summary statistic for multiple years and variables?

R 新手在這里。 我正在做一個項目,我需要將多年的數據組合成每列的單個匯總統計數據。 例如,我有 5 年的數據需要平均,其中有幾列用於不同的變量。 現代潛水作品中提供的例子:

summary_monthly_temp <- weather %>% 
 group_by(month) %>% 
 summarize(mean = mean(temp, na.rm = TRUE), 
 std_dev = sd(temp, na.rm = TRUE)
 ) 

summary_monthly_temp

然后我修改它以滿足我的需要:

summarysummary<- filename%>% 
 group_by(country) %>% 
 summarize(mean = mean(gdp, na.rm = TRUE), 
 std_dev = sd(gdp, na.rm = TRUE)
 )

但在總結 function 中,我需要總結更多變量,例如人口(獲取平均人口)和總 gdp。

做這個的最好方式是什么?

我嘗試了這樣的事情,但它不起作用:

summary<- filename%>% 
 group_by(country) %>% 
 summarize(mean = mean(gdp, na.rm = TRUE), 
  std_dev = sd(gdp, na.rm = TRUE))%>%
 summarize(mean = mean(pop, na.rm = TRUE), 
 std_dev = sd(pop, na.rm = TRUE))%>%

我想我知道為什么......將一個 function 連接到另一個......

感謝您的輸入!

首先,您通常不需要在應用匯總 function 后保存數據,因為它的主要用途是在控制台上生成數據匯總為 output。

現在查看您的代碼,我發現了一個問題:

filename %>% 
 group_by(country) %>% 
 summarize(
   mean = mean(gdp, na.rm = TRUE), 
   std_dev = sd(gdp, na.rm = TRUE)
 )

問題似乎是名為“文件名”的 object,您需要在工作區中將其顯式導入為 R object。 本指南應該可以幫助您從本地文件導入數據: https://github.com/rstudio/cheatsheets/raw/master/data-import.pdf

現在關於 summarise 的使用,如您的示例所示,您可以有多個輸出,假設您的 dataframe 有一個名為“pop”的變量:

actually_a_dataframe%>% 
 group_by(country) %>% 
 summarize(
   mean_gdp = mean(gdp, na.rm = TRUE), 
   std_dev_gdp = sd(gdp, na.rm = TRUE),
   mean_pop = mean(pop, na.rm = TRUE), 
   std_dev_pop = sd(pop, na.rm = TRUE)
 )

這將為每個國家/地區的 gdp 和 pop 生成平均值和標准。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM