是否有更有效的方法来编写 SQL 以按日期和列值对计数进行分组

Question

我有一个 -1 或 1 的状态值定期存储在H2数据库中，我需要计算过去 12 个月内按月存储的 -1 和 1 的数量。 以下代码有效，但我将在多个地方将其用作派生表，并想知道是否有更有效的方法。

SELECT  STATUS_CODE AS STATUS,
    COUNT(*) AS STATUS_COUNT,
    CASE    
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-1,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 1'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-2,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 2'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-3,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 3'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-4,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 4'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-5,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 5'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-6,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 6'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-7,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 7'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-8,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 8'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-9,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 9'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-10,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 10'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-11,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 11'
        WHEN EXTRACT(EPOCH FROM DATEADD(MONTH,-12,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME)   THEN 'MONTH 12'
        ELSE 'DONE' 
    END AS WEEK_RANGE
FROM    MY_TABLE 
WHERE   EXTRACT(EPOCH FROM DATEADD(MONTH,-12,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME) 
GROUP BY STATUS_CODE,  WEEK_RANGE
order by week_range

运行之前的代码的结果。

Answer 1

您可以使用DATEDIFF()动态计算log_entry_time和当前日期之间的差异，以月为单位：

SELECT  
    status_code AS status,
    COUNT(*) AS status_count,
    DATEDIFF(MONTH, log_entry_time, CURRENT_DATE) month_range
FROM MY_TABLE 
WHERE log_entry_time  >= DATEADD(MONTH, -12, CURRENT_DATE)
GROUP BY status_code, month_range
ORDER BY month_range

如果LOG_ENTRY_TIME是类似date的数据类型，请不要将其转换为纪元进行比较，因为这样做会阻止在该列上使用索引。 您可以改为进行日期比较，如上述查询的WHERE子句所示。

Answer 2

这样的东西会更有用吗？

SELECT  STATUS_CODE AS STATUS,
        COUNT(*) AS STATUS_COUNT,
        EXTRACT(YEAR FROM LOG_ENTRY_TIME) || '-' || EXTRACT(MONTH FROM LOG_ENTRY_TIME)
FROM    MY_TABLE 
WHERE   EXTRACT(EPOCH FROM DATEADD(MONTH,-12,CURRENT_DATE)) < EXTRACT(EPOCH FROM LOG_ENTRY_TIME) 
GROUP BY STATUS_CODE,  WEEK_RANGE
order by week_range;

这与您的查询所做的有点不同，但该查询提供实际月份值（例如，“2019-12”）用于可追溯性，而不是通用的“Month N”标签。 即使不完全是你想要达到的目标，也许这会给出一个想法。

（我不确定 Oracle 的TRUNC()的 H2 等价物是什么，但这将有助于收集整月的数据，而不是前一个月的当天；这就是我想要实现的目标。）

是否有更有效的方法来编写 SQL 以按日期和列值对计数进行分组

问题描述

2 个解决方案

解决方案1
2 已采纳 2019-12-27 16:10:15

解决方案2
1 2019-12-27 16:13:40

是否有更有效的方法来编写 SQL 以按日期和列值对计数进行分组

问题描述

2 个解决方案

解决方案1 2 已采纳 2019-12-27 16:10:15

解决方案2 1 2019-12-27 16:13:40

解决方案1
2 已采纳 2019-12-27 16:10:15

解决方案2
1 2019-12-27 16:13:40