Postgresql - 组内的最小/最大日期范围

Question

我们有一个存储数据的事务表，就像一个历史表一样，只要状态发生变化（或其他属性），它就会生效。

例子：

  Product | Status   | Start Date | End Date
----------+------- --+------------+-----------
widget a  | active   | 02/01/2020 | 02/30/2020
widget a  | active   | 03/01/2020 | 03/19/2020
widget a  | inactive | 03/20/2020 | 05/01/2020
widget a  | active   | 05/02/2020 | 08/31/2020
widget b  | active   | 02/01/2020 | 05/31/2020
widget b  | inactive | 06/01/2020 | 06/31/2020

我正在尝试根据状态更改时的最小和最大日期汇总此数据（正如我所说，其他属性会导致记录更改，但我只关心状态更改）。 所以在上面的例子中，“widget a”将有三个记录：从 02/01/2020 - 03/19/2020 开始，从 03/20/2020 - 05/01/2020 开始不活跃，从 05/02/2020 开始活跃 - 2020 年 8 月 31 日。 这可以使用 ETL 工具轻松完成，但我想将其纳入视图。

在注意性能的同时做到这一点的最佳方法是什么

这是 PostgreSQL 10

Answer 1

这是一个间隙和孤岛问题，您希望将具有相同产品和状态的相邻行组合在一起。

这是一种使用行号之间的差异来构建组的方法：

select product, status, min(start_date) start_date, max(end_date) end_date
from (
    select t.*, 
        row_number() over(partition by product order by start_date) rn1,
        row_number() over(partition by product, status order by start_date) rn2
    from mytable t
) t
group by product, rn1 - rn2

Postgresql - 组内的最小/最大日期范围

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-10-14 21:26:57

Postgresql - 组内的最小/最大日期范围

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-10-14 21:26:57

解决方案1
1 已采纳 2020-10-14 21:26:57