在 data.table R 中汇总具有最早开始和最晚结束以及最大值的相同标识符的行

Question

以下data.table

dt <- data.table(
  ID= c(1,2,2,2,2),
  Value1 = c('a','b','a','a','a'),
  Start = c('2001-01-01','2000-01-01','2000-02-02','2000-03-03','2000-03-03'),
  End = c('2002-01-01','2001-01-01','2001-02-02','2001-03-03','2001-03-03'),
  Value_max = c(2,50,20,40,80)
)
   ID Value1      Start        End Value_max
1:  1      a 2001-01-01 2002-01-01         2
2:  2      b 2000-01-01 2001-01-01        50
3:  2      a 2000-02-02 2001-02-02        20
4:  2      a 2000-03-03 2001-03-03        40
5:  2      a 2000-03-03 2001-03-03        80

我想组合具有相同ID和Value1的行，提取最早的Start 、最新的End和最高Value_max 。 我用过dt[,SD.[which.max(Value_max)],by=.c(ID,Value1)]但不知道如何将它与最早的开始和结束日期结合起来。

Answer 1

min和max似乎就足够了：

dt[,.(earliest = min(Start),latest = max(End), value_max = max(Value_max)),by=.(ID,Value1)]
   ID Value1   earliest     latest value_max
1:  1      a 2001-01-01 2002-01-01         2
2:  2      b 2000-01-01 2001-01-01        50
3:  2      a 2000-02-02 2001-03-03        80

在 data.table R 中汇总具有最早开始和最晚结束以及最大值的相同标识符的行

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-06-02 14:16:44

在 data.table R 中汇总具有最早开始和最晚结束以及最大值的相同标识符的行

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-06-02 14:16:44

解决方案1
1 已采纳 2021-06-02 14:16:44