SQL 计算累积总和，根据 Hive 中列中的先前值重置

Question

我试图用这样的东西创造一个累积价值

KEY1    Date_    VAL1    CUMU_VAL2
K1      D1      1       0
K1      D2      1       1
K1      D3      0       2
K1      D4      1       0
K1      D5      1       1

因此，问题基本上是基于 VAL1 中的前一行继续将 CUMU_VAL2 列中的值加 1，但是当 VAL1 列中的前一个值为零时，该总和会重置。 基本上，如果你在 excel 中这样做，那么 Cell(D3) 的公式是

  D3 = IF(C2>0, D2+1, 0)

我相信我应该能够做到这样的事情，但是当以前的值为零时我如何添加案例然后重置总和？

SELECT
   a1.*,
       SUM(a1.VAL1) OVER (PARTITION BY a1.KEY1 ORDER  BY a1.Date_ ) AS CUMU_VAL2
FROM source_table a1

Answer 1

您可以分配一个组——它是给定行后0 的总和。 然后使用count() ：

select t.KEY1, t.Date_, t.VAL1,
       count(*) over (partition by key1, grp, (case when val1 = 0 then 0 else 1 end)
                      order by date_
                     ) as cume_val1
from (select t.*,
             sum(case when a.val1 = 0 then 1 else 0 end) over (partition by key1 order by date_ rows between 1 following and unbounded following) as grp
      from source_table t
     ) t;

如果val1仅采用值 0 和 1，则使用row_number()而不是count() 。

Answer 2

我对@GordonLinoff 的回答的修正，因为 OP 不太明白我的意思。

SELECT
  t.KEY1, t.Date_, t.VAL1,
  ROW_NUMBER() OVER (PARTITION BY key1, grp
                         ORDER BY Date_
                    )
                    - 1
                         AS CUMU_VAL2
FROM
(
  SELECT
    *,
    SUM(
      CASE WHEN val1 = 0 THEN 1 ELSE 0 END
    )
    OVER (
      PARTITION BY key1
          ORDER BY date_
    )
      AS grp
  FROM
    source_table
)
  t;

SQL 计算累积总和，根据 Hive 中列中的先前值重置

问题描述

2 个解决方案

解决方案1
1 2018-09-24 21:38:03

解决方案2
1 已采纳 2018-09-24 22:08:39

SQL 计算累积总和，根据 Hive 中列中的先前值重置

问题描述

2 个解决方案

解决方案1 1 2018-09-24 21:38:03

解决方案2 1 已采纳 2018-09-24 22:08:39

解决方案1
1 2018-09-24 21:38:03

解决方案2
1 已采纳 2018-09-24 22:08:39