[英]Optimize Join GreenPlum
我的表 A 有 2000 萬條記錄。 表 B 有 200,000 條記錄。 我想做一個像:
select *
from tableA a
left join tableB b
on ((a.name1 = b.name1 OR a.name1 = b.name2) OR a.id = b.id)
and a.time > b.time
;
這是非常耗時的。 我正在使用 GreenPlum,所以我無法使用索引。 我怎樣才能優化這個? 表 B 中的行數是遞增的,並且會增加。
Greenplum 確實支持索引。 但是,這個查詢很棘手,因為您的分布列是什么並不重要,由於以下原因,無法共同定位連接。
我不確定該查詢是否對 MPP 非常友好。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.