簡體   English   中英

在 R 中提取唯一列組合並查找總和和計數

[英]Extracting unique column combination and finding sum and count in R

我有一個包含 4 列的航班數據庫,如下所示。

原來的:

我想要一個 output,它根據 3 col(出發地/目的地/航空公司)的唯一組合給出行,將每個唯一組合的乘客數量相加,並計算每個唯一組合的行數。 結果將是這樣的。

Output:

我可以使用group_by function 完成其中的一部分

df %>% group_by(Origin, destination, carrier) %>% summarise(count = n())

如何包括人口總和?

我們可以使用dplyr

library(dplyr)
df1 %>%
   group_by(Origin, Destination, Airline) %>%
   dplyr::summarise(count = n(), TotalPassengers = sum(Passengers))
# Groups:   Origin, Destination [2]
#  Origin Destination Airline count TotalPassengers
#  <chr>  <chr>       <chr>   <int>           <dbl>
#1 ABE    ATL         9A          2               3
#2 ABE    ATL         DL          1               5
#3 NYC    SFA         AA          3              21
#4 NYC    SFA         DL          1               5

數據

df1 <- data.frame(Origin = rep(c("ABE", "NYC"), c(3, 4)),
      Destination = rep(c("ATL", "SFA"), c(3, 4)),
      Airline = c("9A", "9A", "DL", "AA", "AA", "AA", "DL"),
      Passengers = c(2, 1, 5, 4, 10, 7, 5))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM