group_by和summary（）使用dplyr / tidyverse在R中進行多項操作

Question

我正在嘗試找到平均年齡最高的國家，但我還需要過濾掉數據框中條目少於5個的國家。 我嘗試了以下操作，但不起作用：

bil %>% 
  group_by(citizenship,age) %>% 
  mutate(n=count(citizenship), theMean=mean(age,na.rm=T)) %>% 
  filter(n>=5) %>% 
  arrange(desc(theMean))

bil是數據集，我試圖計算每個國家/地區有多少條目，過濾出條目少於5個的國家/地區，找到每個國家/地區的平均年齡，然后找到平均值最高的國家/地區。 我對如何同時做兩件事感到困惑。 如果我一次做一個匯總，我將丟失其余數據。

Answer 1

也許，這可能會有所幫助。 請注意， count中的參數“ x”是tbl/data.frame 。 因此，我們不使用count而是按“公民身份”進行分組，並使用n()獲得值的頻率，獲取“ age”的mean （不確定“ age”是否為分組變量）並進行filter

bil %>%
   group_by(citizenship) %>% 
   mutate(n = n()) %>%     
   mutate(theMean = mean(age, na.rm=TRUE)) %>% 
   filter(n>=5) %>%
   arrange(desc(theMean))

group_by和summary（）使用dplyr / tidyverse在R中進行多項操作

問題描述

1 個解決方案

解決方案1
2 2018-09-29 18:45:58

group_by和summary（）使用dplyr / tidyverse在R中進行多項操作

問題描述

1 個解決方案

解決方案1 2 2018-09-29 18:45:58

解決方案1
2 2018-09-29 18:45:58