[英]Get max value from a window of rows as new column for all rows
| col 1 | col 2 | col 3 |
|-------|-------|-------|
| 67458 | ADM | 1008 |
| 67458 | ADM | 1009 |
| 67458 | SKI | 1009 |
| 67458 | LIS | 1010 |
| 67458 | TOU | 1121 |
当col2='ADM'
时,如何获取col3
最大值并将其用作其余记录的值?
预期结果:
| col 1 | col 2 | col 3 | col 4 |
|-------|-------|-------|-------|
| 67458 | ADM | 1008 | 1009 |
| 67458 | ADM | 1009 | 1009 |
| 67458 | SKI | 1009 | 1009 |
| 67458 | LIS | 1010 | 1009 |
| 67458 | TOU | 1121 | 1009 |
我知道如何使用子选择和所有选择。 col4
将是一个伪列,将在下游用于JOIN和填充。
我尝试了以下方法,但它填充了1121而不是1009 :
MAX(col3) OVER (PARTITION BY col1 (CASE WHEN col2='ADM' THEN col2 END) ORDER BY col1)
您可以使用相关子查询:
select t.*,
(select max(t1.col3) from table t1 where t1.col1 = t.col1 and t1.col2 = 'ADM') as col4
from table t;
使用窗口功能:
select t.*,
max(col3) filter (where col2 = 'ADM') over (partition by col1) as col4
from t;
在Redshift中,您可能必须使用用case
:
select t.*,
max(case when col2 = 'ADM' then col3 end) over (partition by col1) as col4
from t;
您可以在SELECT
使用子查询来获取该值。
如果您介意一次又一次执行并交叉连接,则此suq查询可以存储在变量中。
模式(PostgreSQL v10.0)
CREATE TABLE test (
"col 1" INTEGER,
"col 2" VARCHAR(3),
"col 3" INTEGER
);
INSERT INTO test
("col 1", "col 2", "col 3")
VALUES
('67458', 'ADM', '1008'),
('67458', 'ADM', '1009'),
('67458', 'SKI', '1009'),
('67458', 'LIS', '1010'),
('67458', 'TOU', '1121');
查询#1
SELECT MAX("col 3") AS "col 4" INTO col4 FROM test t2 WHERE t2."col 2" = 'ADM';
没有要显示的结果。
查询#2
SELECT "col 1",
"col 2",
"col 3",
"col 4"
FROM test
CROSS JOIN
col4;
产量
| col 1 | col 2 | col 3 | col 4 |
| ----- | ----- | ----- | ----- |
| 67458 | ADM | 1008 | 1009 |
| 67458 | ADM | 1009 | 1009 |
| 67458 | SKI | 1009 | 1009 |
| 67458 | LIS | 1010 | 1009 |
| 67458 | TOU | 1121 | 1009 |
SELECT t.*, max(CASE WHEN col2 = 'ADM' THEN col3 END) OVER (PARTITION BY col1) AS col4
FROM tbl t;
聚合的FILTER
子句是PostgreSQL 9.4中引入的,对此非常有用。 但是Redshift不是Postgres,并且在Postgres中大多数后来的添加都不受支持。 相比:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.