INSERT INTO table SELECT Redshift 超慢

Question

我们有一张大桌子，我们需要对其进行深度复制。 由于我们没有足够的空磁盘空间来在一个语句中创建它，因此我尝试批量创建它。 但是批次似乎运行得非常非常缓慢。

我正在运行这样的东西：

   INSERT INTO new_table 
   SELECT * FROM old_table 
    WHERE creation_date between '2018-01-01' AND '2018-02-01'

即使查询返回少量行 ~ 1K

SELECT * FROM old_table 
WHERE creation_date between '2018-01-01' AND '2018-02-01'

INSERT查询大约需要 50 分钟才能完成。
old_table有 ~286M 行和 ~400 列
creation_date是SORTKEY之一

解释计划看起来像：

XN Seq Scan on old_table  (cost=0.00..4543811.52 rows=178152 width=136883)
      Filter: ((creation_date <= '2018-02-01'::date) AND (creation_date >= '2018 01-01'::date))

我的问题是：

INSERT查询花费这么长时间的原因可能是什么？

Answer 1

在我看来，以下是两种可能性——不过，如果您能在问题中添加更多细节，那就太好了。

正如@John 在评论中所说，您的 SORTKEY 在 RedShift 中很重要，是creation_date排序键？
您是否对old_table进行了大量更新，如果是这样，您必须先真空执行VACUUM DELETE Only old_table然后，执行选择查询。

其他选项，您可能正在使用 S3 方式，但不确定您是否想要这样做。

INSERT INTO table SELECT Redshift 超慢

问题描述

1 个解决方案

解决方案1
4 已采纳 2018-05-28 05:58:47

INSERT INTO table SELECT Redshift 超慢

问题描述

1 个解决方案

解决方案1 4 已采纳 2018-05-28 05:58:47

解决方案1
4 已采纳 2018-05-28 05:58:47