聚合 SQL 中的连续行

Question

鉴于 sql 表（我使用的是 SQLite3）：

CREATE TABLE person(name text, number integer);

并填充值：

insert into person values 
('Leandro', 2),
('Leandro', 4),
('Maria',   8),
('Maria',   16),
('Jose',    32),
('Leandro', 64);

我想要的是获取number列的总和，但仅限于连续行，以便我可以得到保持原始插入顺序的结果：

Leandro|6
Maria|24
Jose|32
Leandro|64

到目前为止我得到的“最接近”是：

select name, sum(number) over(partition by name) from person order by rowid;

但它清楚地表明我对 SQL 的理解还很远，因为缺少最重要的功能（连续行的分组和求和），但至少顺序是：-)：

Leandro|70
Leandro|70
Maria|24
Maria|24
Jose|32
Leandro|70

最好答案不应该要求创建临时表，因为预计输出的顺序总是与数据插入的顺序相同。

Answer 1

您可以使用窗口函数来做到这一点：

LAG() 检查前一个名称是否与当前名称相同
SUM() 为连续的同名创建组

然后按组分组并聚合：

select name, sum(number) total
from (
  select *, sum(flag) over (order by rowid) grp
  from (
    select *, rowid, name <> lag(name, 1, '') over (order by rowid) flag
    from person 
  )
)
group by grp

请参阅演示。
结果：

> name    | total
> :------ | ----:
> Leandro |     6
> Maria   |    24
> Jose    |    32
> Leandro |    64

Answer 2

这是一种间隙和岛屿问题。 为此，您可以使用行号的差异：

select name, sum(number)
from (select p.*,
             row_number() over (order by number) as seqnum,
             row_number() over (partition by name order by number) as seqnum_1
      from person p
     ) p
group by name, (seqnum - seqnum_1)
order by. min(number);

为什么这行得通有点难以解释。 但是，当您查看子查询的结果时，它变得非常明显。 当名称不变时，相邻行的行号差异是恒定的。

这是一个 db<>fiddle。

Answer 3

我会将 create table 语句更改为以下内容：

CREATE TABLE person(id integer, firstname nvarchar(255), number integer);

您需要第三列来确定插入顺序
我会将列名重命名为 firstname 之类的名称，因为 name 是某些 DBMS 中的关键字。 这也适用于名为 number 的列。 此外，我会将名称的文本类型更改为 nvarchar，因为它可以按原因在组中排序。

然后你可以插入你的数据：

insert into person values 
(1, 'Leandro', 2),
(2, 'Leandro', 4),
(3, 'Maria',   8),
(4, 'Maria',   16),
(5, 'Jose',    32),
(6, 'Leandro', 64);

之后，您可以通过以下方式查询数据：

SELECT firstname, value FROM (
    SELECT p.id, p.firstname, p.number, LAG(p.firstname) over (ORDER BY p.id) as prevname,
    CASE
        WHEN firstname LIKE LEAD(p.firstname) over (ORDER BY p.id) THEN number + LEAD(p.number) over(ORDER BY p.id)
        ELSE number
    END as value
    FROM Person p
) AS temp
WHERE temp.firstname <> temp.prevname OR 
temp.prevname IS NULL

首先你在case语句中选择值
然后过滤数据并查看以前名称不是实际名称的条目。

为了更好地理解查询，您可以单独运行子查询：

SELECT p.id, p.firstname, p.number, LEAD(p.firstname) over (ORDER BY p.id) as nextname, LAG(p.firstname) over (ORDER BY p.id) as prevname,
CASE
    WHEN firstname LIKE LEAD(p.firstname) over (ORDER BY p.id) THEN number + LEAD(p.number) over(ORDER BY p.id)
    ELSE number
END as value
FROM Person p

Answer 4

基于 Gordon Linoff 的回答 ( https://stackoverflow.com/a/64727401/1721672 )，我将内部选择提取为 CTE，以下查询效果很好：

with p(name, number, seqnum, seqnum_1) as
    (select name, number,
        row_number() over (order by number) as seqnum,
        row_number() over (partition by name order by number) as seqnum_1
    from person)
select
    name, sum(number)
from
    p
group by 
    name, (seqnum - seqnum_1)
order by
    min(number);

产生预期结果：

Leandro|6
Maria|24
Jose|32
Leandro|64

聚合 SQL 中的连续行

问题描述

4 个解决方案

解决方案1
1 2020-11-07 11:56:53

解决方案2
1 2020-11-07 11:57:51

解决方案3
1 2020-11-07 12:48:49

解决方案4
0 2020-11-07 13:54:04

聚合 SQL 中的连续行

问题描述

4 个解决方案

解决方案1 1 2020-11-07 11:56:53

解决方案2 1 2020-11-07 11:57:51

解决方案3 1 2020-11-07 12:48:49

解决方案4 0 2020-11-07 13:54:04

解决方案1
1 2020-11-07 11:56:53

解决方案2
1 2020-11-07 11:57:51

解决方案3
1 2020-11-07 12:48:49

解决方案4
0 2020-11-07 13:54:04