[英]Assigning sequential numbers to dates in SQL
我正在尝试在 SQL 中存储彼此在 30 天 window 内的日期。 对于下面示例数据中的每个 ID 号,我如何分配一个桶号,每次相邻日期之间的间隔超过 30 天时都会增加 1?
示例数据:
create table dates_bucket (ID integer, DATE date);
insert into dates_bucket (ID, DATE)
values
('123', '2019-04-04'),
('123', '2019-04-06'),
('123', '2019-09-09'),
('123', '2019-09-10'),
('123', '2019-10-01'),
('123', '2019-11-30'),
('345', '2013-03-12'),
('345', '2013-05-23'),
('345', '2014-09-03'),
('345', '2019-10-23'),
('345', '2019-10-25');
我需要 output 看起来像这样:
ID DATE ROW_NUM
123 2019-04-04 1
123 2019-04-06 1
123 2019-09-09 2
123 2019-09-10 2
123 2019-10-01 2
123 2019-11-30 3
345 2013-03-12 1
345 2013-05-23 2
345 2014-09-03 3
345 2019-10-23 4
345 2019-10-25 4
如果它是相关的,我在 Netezza 工作。
这是一个间隙和岛屿问题,其中岛屿是相邻的日期,间隔不到一个月。 我建议lag()
获取上一个日期,并且满足增加超过 30 天差距的累积sum()
:
select id, date,
sum(case when date <= lag_date + interval '30 day' then 0 else 1 end)
over(partition by id order by date) as grp
from (
select d.*,
lag(date) over(partition by id order by date) lag_date
from dates_buckets d
) d
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.