簡體   English   中英

在AWS Redshift中透視非數值表

[英]Pivoting a non-numeric table in AWS Redshift

我有一張要在Amazon Redshift中進行旋轉的表格,我想沿一列旋轉。 例如

dim1  dim2  val
x     a     4s
x     b     5v
y     a     9l
y     b     3t

會變成:

dim1   a    b  
x      4s   5v
y      9l   3t

請注意,AWS Redshift不支持數據透視表,交叉表,嵌套嵌套或大小寫擴展。 另外,AWS在https://forums.aws.amazon.com/thread.jspa?threadID=126369中提出的解決方案還不夠,因為它依賴於使用聚合函數,並且由於我的數據不包含數字,因此不會工作可靠(對嗎?)。

我一直想出的最好的解決方案是自我加入:

SELECT table.dim1, val as a, b
FROM table
WHERE dim2='a'
JOIN (
  SELECT dim1, val as b 
  FROM table
  WHERE dim2='b') AS t
ON t.dim1 = table.dim1

該解決方案的問題在於,您必須對dim2每個可能值進行一次自我連接,並且由於我的表很大並且dim2有20多個不同的值, dim2這很快變得難以管理。 對於dim2每個新值,我必須執行另一個自我連接,因此:

SELECT table.dim1, val as a, b, c
FROM table
WHERE dim2='a'
JOIN (
  SELECT dim1, val as b 
  FROM table
  WHERE dim2='b') AS t
ON t.dim1 = table.dim1
JOIN (
  SELECT dim1, val as c 
  FROM table
  WHERE dim2='c') AS t2
ON t2.dim1 = table.dim1

我們可以看到如何快速擺脫困境。 有一個更好的方法嗎?

事實證明,AWS答案就足夠了,您可以使用max()來匯總字符串:

SELECT dim1, MAX(a) AS a, MAX(b) AS b
FROM (
  SELECT dim1, 
    CASE dim2 WHEN 'a' THEN val ELSE NULL END as a,
    CASE dim2 WHEN 'b' THEN val ELSE NULL END as b
  FROM table
)
GROUP BY dim1;

但是在dim2任意大量的值仍然很麻煩。 我願意提供更好的答案。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM