[英]Count Distinct over partition by sql
我有一張桌子
col1ID col2String Col3ID Col4String Col5Data
1 xxx 20 abc 14-09-2018
1 xxx 20 xyz 14-09-2018
2 xxx 30 abc 14-09-2018
2 xxx 30 abc 14-09-2018
我想添加一列,該列通過col1ID和col3ID計算col4String組中有多少個不同的字符串。
所以像
COUNT(DISTINCT (Col4String)) over (partition by col1ID, col3ID)
但它不起作用,我收到一個錯誤
OVER子句不允許使用DISTINCT。
消息102,第15級,州1,第23行。
我有更多列,例如col2String和col5Data,但它們不應該受到影響,因此我不能在SELECT
的開頭使用distinct,而且我的情況下dense_rank()
似乎也不起作用。
謝謝你的幫助。
嘗試這個:
DECLARE @DataSource TABLE
(
[col1ID] INT
,[col2String] VARCHAR(12)
,[Col3ID] INT
,[Col4String] VARCHAR(12)
,[Col5Data] DATE
);
INSERT INTO @DataSource
VALUES (1, 'xxx', 20, 'abc', '2018-09-14')
,(1, 'xxx', 20, 'xyz', '2018-09-14')
,(2, 'xxx', 30, 'abc', '2018-09-14')
,(2, 'xxx', 30, 'abc', '2018-09-14');
SELECT *
,dense_rank() over (partition by col1ID, col3ID order by [Col4String]) + dense_rank() over (partition by col1ID, col3ID order by [Col4String] desc) - 1
FROM @DataSource
顯然,SQL Server的窗口功能不支持distinct,因此,您可以改用子查詢。 遵循以下原則:
select (
select COUNT(DISTINCT Col4String)
from your_table t2
where t1.col1ID = t2.col1ID and t1.col3ID = t2.col3ID
)
from your_table t1
嘗試這種方式;
select * from TableX X
outer apply(select count(*) as stringCount , X2.Col4String
from TableX X2 on X.col1ID= X2.col1ID and X.col3ID = X2.col3ID
group by X2.Col4String ) K
我會使用APPLY
:
SELECT t.*, t1.Col4String_Cnt
FROM table t CROSS APPLY
(SELECT COUNT(DISTINCT t1.Col4String) AS Col4String_Cnt
FROM table t1
WHERE t1.col1ID = t.col1ID AND t1.col3ID = t.col3ID
) t1;
您可以使用附加級別的窗口功能來執行此操作。 一種方法使用dense_rank()
:
SELECT . . .,
MAX(DR) OVER (PARTITION BY col1ID, col3ID)
FROM (SELECT t.*,
DENSE_RANK() OVER (PARTITION BY col1ID, col3ID ORDER BY Col4String) as dr
FROM t
) t
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.