[英]Informix to HiveQL
我有一個為 Informix 編寫的 SQL 查詢
SELECT cols
FROM table1 t1, outer(table2 t2, table3 t3)
WHERE t1.id = t2.id and t2.type = t3.type
我們在 Hive 上有相同的表和數據,我想將其轉換為 HiveQL
使用 LEFT JOINs 而不是 OUTER
SELECT cols
FROM table1 t1
LEFT JOIN table2 t2 ON t1.id = t2.id
LEFT JOIN table3 t3 ON t2.type = t3.type
Informix 樣式的外連接非常有趣、獨特且完全非標准。 Informix 對 ANSI (ISO) 標准 SQL 外連接的實現應該是完全無聊的,並且與其他 DBMS 相同。
這是一個 SQL 腳本,它創建和填充 3 個表並針對這些表執行 5 個不同的查詢。
CREATE TABLE table1
(
id SERIAL NOT NULL PRIMARY KEY,
data VARCHAR(32) NOT NULL
);
CREATE TABLE table2
(
id INTEGER NOT NULL,
type INTEGER NOT NULL,
info VARCHAR(32) NOT NULL,
PRIMARY KEY(id, type)
);
CREATE TABLE table3
(
type INTEGER NOT NULL PRIMARY KEY,
name VARCHAR(32) NOT NULL
);
INSERT INTO table1 VALUES(100, 'Table 1 - ID 100');
INSERT INTO table1 VALUES(101, 'Table 1 - ID 101');
INSERT INTO table1 VALUES(102, 'Table 1 - ID 102');
INSERT INTO table1 VALUES(103, 'Table 1 - ID 103');
INSERT INTO table1 VALUES(104, 'Table 1 - ID 104');
INSERT INTO table2 VALUES(100, 300, 'Table 2 - ID 100, Type 300');
INSERT INTO table2 VALUES(100, 301, 'Table 2 - ID 100, Type 301');
INSERT INTO table2 VALUES(100, 302, 'Table 2 - ID 100, Type 302');
INSERT INTO table2 VALUES(101, 301, 'Table 2 - ID 101, Type 301');
INSERT INTO table2 VALUES(101, 400, 'Table 2 - ID 101, Type 400');
INSERT INTO table2 VALUES(101, 302, 'Table 2 - ID 101, Type 302');
INSERT INTO table2 VALUES(103, 302, 'Table 2 - ID 103, Type 302');
INSERT INTO table2 VALUES(103, 303, 'Table 2 - ID 103, Type 303');
INSERT INTO table2 VALUES(103, 300, 'Table 2 - ID 103, Type 300');
INSERT INTO table2 VALUES(107, 300, 'Table 2 - ID 107, Type 300');
INSERT INTO table2 VALUES(107, 400, 'Table 2 - ID 107, Type 400');
INSERT INTO table3 VALUES(300, 'Table 3 - Type 300');
INSERT INTO table3 VALUES(301, 'Table 3 - Type 301');
INSERT INTO table3 VALUES(302, 'Table 3 - Type 302');
INSERT INTO table3 VALUES(303, 'Table 3 - Type 303');
INSERT INTO table3 VALUES(304, 'Table 3 - Type 304');
INSERT INTO table3 VALUES(305, 'Table 3 - Type 305');
SELECT t1.id as t1_id, t1.data, t2.id as t2_id, t2.type as t2_type, t2.info, t3.type as t3_type, t3.name
FROM table1 t1, OUTER(table2 t2, table3 t3)
WHERE t1.id = t2.id AND t2.type = t3.type;
SELECT t1.id as t1_id, t1.data, t2.id as t2_id, t2.type as t2_type, t2.info, t3.type as t3_type, t3.name
FROM table1 t1, OUTER(table2 t2, OUTER table3 t3)
WHERE t1.id = t2.id AND t2.type = t3.type;
SELECT t1.id as t1_id, t1.data, t2.id as t2_id, t2.type as t2_type, t2.info, t3.type as t3_type, t3.name
FROM table1 t1
LEFT JOIN table2 t2 ON t1.id = t2.id
LEFT JOIN table3 t3 ON t2.type = t3.type;
SELECT t1.id as t1_id, t1.data, s.join_key as t2_id, s.t2_type, s.info, s.t3_type, s.name
FROM table1 t1
LEFT JOIN
(SELECT t2.id AS join_key, t2.info, t3.name, t2.type as t2_type, t3.type as t3_type
FROM table2 t2
JOIN table3 t3 ON t2.type = t3.type
) s ON s.join_key = t1.id;
SELECT t1.id as t1_id, t1.data, t2.id as t2_id, t2.type as t2_type, t2.info, t3.type as t3_type, t3.name
FROM table1 t1
LEFT JOIN table2 t2 ON t1.id = t2.id
JOIN table3 t3 ON t2.type = t3.type;
第一個查詢是來自問題的查詢,指定了選定的列名。 每個查詢中的列名列表都是相同的。
第二個查詢是一個變體,使用額外的 OUTER 關鍵字。 它對應於第三個查詢,這是leftjoin創建的第一個答案。 第三個查詢是@leftjoin 生成的第一個查詢。 第四個查詢是@leftjoin 創建的“當前答案” (嚴格來說是第三個修訂版)。 第五個查詢是第四個查詢的變體——它產生不同的答案,所以它不等價。
這些是查詢的輸出。
SELECT t1.id as t1_id, t1.data, t2.id as t2_id, t2.type as t2_type, t2.info, t3.type as t3_type, t3.name
FROM table1 t1, OUTER(table2 t2, table3 t3)
WHERE t1.id = t2.id AND t2.type = t3.type;
t1_id | 數據 | t2_id | t2_type | 信息 | t3_type | 姓名 |
---|---|---|---|---|---|---|
100 | 表 1 - ID 100 | 100 | 300 | 表 2 - ID 100,300 型 | 300 | 表 3 - 300 型 |
100 | 表 1 - ID 100 | 100 | 301 | 表 2 - ID 100,301 型 | 301 | 表 3 - 301 型 |
100 | 表 1 - ID 100 | 100 | 302 | 表 2 - ID 100,302 型 | 302 | 表 3 - 302 型 |
101 | 表 1 - ID 101 | 101 | 301 | 表 2 - ID 101,301 型 | 301 | 表 3 - 301 型 |
101 | 表 1 - ID 101 | 101 | 302 | 表 2 - ID 101,302 型 | 302 | 表 3 - 302 型 |
102 | 表 1 - ID 102 | |||||
103 | 表 1 - ID 103 | 103 | 300 | 表 2 - ID 103,300 型 | 300 | 表 3 - 300 型 |
103 | 表 1 - ID 103 | 103 | 302 | 表 2 - ID 103,302 型 | 302 | 表 3 - 302 型 |
103 | 表 1 - ID 103 | 103 | 303 | 表 2 - ID 103,303 型 | 303 | 表 3 - 303 型 |
104 | 表 1 - ID 104 |
SELECT t1.id as t1_id, t1.data, t2.id as t2_id, t2.type as t2_type, t2.info, t3.type as t3_type, t3.name
FROM table1 t1, OUTER(table2 t2, OUTER table3 t3)
WHERE t1.id = t2.id AND t2.type = t3.type;
t1_id | 數據 | t2_id | t2_type | 信息 | t3_type | 姓名 |
---|---|---|---|---|---|---|
100 | 表 1 - ID 100 | 100 | 300 | 表 2 - ID 100,300 型 | 300 | 表 3 - 300 型 |
100 | 表 1 - ID 100 | 100 | 301 | 表 2 - ID 100,301 型 | 301 | 表 3 - 301 型 |
100 | 表 1 - ID 100 | 100 | 302 | 表 2 - ID 100,302 型 | 302 | 表 3 - 302 型 |
101 | 表 1 - ID 101 | 101 | 301 | 表 2 - ID 101,301 型 | 301 | 表 3 - 301 型 |
101 | 表 1 - ID 101 | 101 | 302 | 表 2 - ID 101,302 型 | 302 | 表 3 - 302 型 |
101 | 表 1 - ID 101 | 101 | 400 | 表 2 - ID 101,400 型 | ||
102 | 表 1 - ID 102 | |||||
103 | 表 1 - ID 103 | 103 | 300 | 表 2 - ID 103,300 型 | 300 | 表 3 - 300 型 |
103 | 表 1 - ID 103 | 103 | 302 | 表 2 - ID 103,302 型 | 302 | 表 3 - 302 型 |
103 | 表 1 - ID 103 | 103 | 303 | 表 2 - ID 103,303 型 | 303 | 表 3 - 303 型 |
104 | 表 1 - ID 104 |
SELECT t1.id as t1_id, t1.data, t2.id as t2_id, t2.type as t2_type, t2.info, t3.type as t3_type, t3.name
FROM table1 t1
LEFT JOIN table2 t2 ON t1.id = t2.id
LEFT JOIN table3 t3 ON t2.type = t3.type;
t1_id | 數據 | t2_id | t2_type | 信息 | t3_type | 姓名 |
---|---|---|---|---|---|---|
100 | 表 1 - ID 100 | 100 | 300 | 表 2 - ID 100,300 型 | 300 | 表 3 - 300 型 |
100 | 表 1 - ID 100 | 100 | 301 | 表 2 - ID 100,301 型 | 301 | 表 3 - 301 型 |
100 | 表 1 - ID 100 | 100 | 302 | 表 2 - ID 100,302 型 | 302 | 表 3 - 302 型 |
101 | 表 1 - ID 101 | 101 | 301 | 表 2 - ID 101,301 型 | 301 | 表 3 - 301 型 |
101 | 表 1 - ID 101 | 101 | 302 | 表 2 - ID 101,302 型 | 302 | 表 3 - 302 型 |
101 | 表 1 - ID 101 | 101 | 400 | 表 2 - ID 101,400 型 | ||
102 | 表 1 - ID 102 | |||||
103 | 表 1 - ID 103 | 103 | 300 | 表 2 - ID 103,300 型 | 300 | 表 3 - 300 型 |
103 | 表 1 - ID 103 | 103 | 302 | 表 2 - ID 103,302 型 | 302 | 表 3 - 302 型 |
103 | 表 1 - ID 103 | 103 | 303 | 表 2 - ID 103,303 型 | 303 | 表 3 - 303 型 |
104 | 表 1 - ID 104 |
SELECT t1.id as t1_id, t1.data, s.join_key as t2_id, s.t2_type, s.info, s.t3_type, s.name
FROM table1 t1
LEFT JOIN
(SELECT t2.id AS join_key, t2.info, t3.name, t2.type as t2_type, t3.type as t3_type
FROM table2 t2
JOIN table3 t3 ON t2.type = t3.type
) s ON s.join_key = t1.id;
t1_id | 數據 | t2_id | t2_type | 信息 | t3_type | 姓名 |
---|---|---|---|---|---|---|
100 | 表 1 - ID 100 | 100 | 300 | 表 2 - ID 100,300 型 | 300 | 表 3 - 300 型 |
100 | 表 1 - ID 100 | 100 | 301 | 表 2 - ID 100,301 型 | 301 | 表 3 - 301 型 |
100 | 表 1 - ID 100 | 100 | 302 | 表 2 - ID 100,302 型 | 302 | 表 3 - 302 型 |
101 | 表 1 - ID 101 | 101 | 301 | 表 2 - ID 101,301 型 | 301 | 表 3 - 301 型 |
101 | 表 1 - ID 101 | 101 | 302 | 表 2 - ID 101,302 型 | 302 | 表 3 - 302 型 |
102 | 表 1 - ID 102 | |||||
103 | 表 1 - ID 103 | 103 | 300 | 表 2 - ID 103,300 型 | 300 | 表 3 - 300 型 |
103 | 表 1 - ID 103 | 103 | 302 | 表 2 - ID 103,302 型 | 302 | 表 3 - 302 型 |
103 | 表 1 - ID 103 | 103 | 303 | 表 2 - ID 103,303 型 | 303 | 表 3 - 303 型 |
104 | 表 1 - ID 104 |
SELECT t1.id as t1_id, t1.data, t2.id as t2_id, t2.type as t2_type, t2.info, t3.type as t3_type, t3.name
FROM table1 t1
LEFT JOIN table2 t2 ON t1.id = t2.id
JOIN table3 t3 ON t2.type = t3.type;
t1_id | 數據 | t2_id | t2_type | 信息 | t3_type | 姓名 |
---|---|---|---|---|---|---|
100 | 表 1 - ID 100 | 100 | 300 | 表 2 - ID 100,300 型 | 300 | 表 3 - 300 型 |
103 | 表 1 - ID 103 | 103 | 300 | 表 2 - ID 103,300 型 | 300 | 表 3 - 300 型 |
100 | 表 1 - ID 100 | 100 | 301 | 表 2 - ID 100,301 型 | 301 | 表 3 - 301 型 |
101 | 表 1 - ID 101 | 101 | 301 | 表 2 - ID 101,301 型 | 301 | 表 3 - 301 型 |
100 | 表 1 - ID 100 | 100 | 302 | 表 2 - ID 100,302 型 | 302 | 表 3 - 302 型 |
101 | 表 1 - ID 101 | 101 | 302 | 表 2 - ID 101,302 型 | 302 | 表 3 - 302 型 |
103 | 表 1 - ID 103 | 103 | 302 | 表 2 - ID 103,302 型 | 302 | 表 3 - 302 型 |
103 | 表 1 - ID 103 | 103 | 303 | 表 2 - ID 103,303 型 | 303 | 表 3 - 303 型 |
除非我錯過了什么,否則 Q1 和 Q4 的輸出是相同的(所以@leftjoin 的答案是正確的); 其他查詢的輸出都彼此不同(以及來自 Q1 和 Q4)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.