按多個變量分組並匯總 dplyr

Question

我正在嘗試每 30 秒為我的每個傳感器平均 CO2 濃度數據：

    head(df)
# A tibble: 6 x 7
# Groups: BinnedTime [1]

  Sensor Date       Time   calCO2 DeviceTime          cuts   BinnedTime         
  <fctr> <date>     <time>  <dbl> <dttm>              <fctr> <chr>              
1 N1     2019-02-12 13:24     400 2019-02-12 13:24:02 (0,10] 2019-02-12 13:24:02
2 N1     2019-02-12 13:24     400 2019-02-12 13:24:02 (0,10] 2019-02-12 13:24:02
3 N1     2019-02-12 13:24     400 2019-02-12 13:24:03 (0,10] 2019-02-12 13:24:03
4 N2     2019-02-12 13:24     400 2019-02-12 13:24:03 (0,10] 2019-02-12 13:24:02
5 N3     2019-02-12 13:24     400 2019-02-12 13:24:03 (0,10] 2019-02-12 13:24:02
6 N3     2019-02-12 13:24     400 2019-02-12 13:24:05 (0,10] 2019-02-12 13:24:04

我用：

df %>%
  group_by(Sensor)%>%
  group_by(BinnedTime = cut(DeviceTime, breaks="30 sec")) %>%
  summarize(Concentration = mean(calCO2))

但它不會首先按 Sensor 分組，而是忽略它們並計算 BinnedTime 的平均值。 任何想法都會受到歡迎。

我讀過.dots=c("Sensor","BinnedTime")但這不起作用。

請注意，我沒有創建虛擬數據，因此您可以確切地看到我的數據，因為時間和日期似乎有些微妙之處，我無法完全理解。

Answer 1

因此，總結@kath 的評論並進行一些改進以解決您的后續問題：

df %>%
    group_by(Sensor, BinnedTime = cut(DeviceTime, breaks="30 sec")) %>%
        mutate(Concentration = mean(calCO2)) %>%
    ungroup()

以上將保留所有列，但重復 df 每一行的濃度計算。 允許您匯總並保留更多感興趣的列的替代方法是將它們簡單地添加到匯總操作中，如下所示。

    df %>%
    group_by(Sensor, BinnedTime = cut(DeviceTime, breaks="30 sec")) %>%
        summarize(Concentration = mean(calCO2),
                   Date = min(Date),
                   Time = min(Time),
                   StartDeviceTime = min(DeviceTime),
                   EndDeviceTime = max(DeviceTime))

按多個變量分組並匯總 dplyr

問題描述

1 個解決方案

解決方案1
1 已采納 2019-02-18 00:34:06

按多個變量分組並匯總 dplyr

問題描述

1 個解決方案

解決方案1 1 已采納 2019-02-18 00:34:06

解決方案1
1 已采納 2019-02-18 00:34:06