在postgres中增加3亿个条目的最佳方法？

Question

我每天都有一个新的csv文件，其中包含4亿多个条目，需要向上插入数据库（3个表和2个外键，已索引）。 表中已经有大多数条目，在这种情况下，我需要更新一列。 需要插入表中尚未存在的某些条目。

我试图每天将CSV插入到temptable然后运行：

INSERT INTO restaurants (name, food_id, street_id, datecreated, lastdayobservedopen) SELECT DISTINCT temptable.name, typesoffood.food_id, location.street_id, temptable.datecreated, temptable.lastdayobservedopen FROM temptable INNER JOIN typesoffood on typesoffood.food_type = temptable.food_type INNER JOIN location ON location.street_name = temptable.street_name ON CONFLICT ON CONSTRAINT restaurants_pk DO UPDATE SET lastdayobservedopen = EXCLUDED.lastdayobservedopen

但这需要6个小时以上。

有可能使它更快吗？

编辑：

更多详细信息：3个表-餐馆（名称，food_id，street_id，创建日期，lastdayobservedopen）以及pk（名称，street_id）和fks（food_id和street_id）； 带有pk（food_id）和food_type索引的食品类型（food_id，food_type）; 带有pk（street_id）的位置（street_id，street_name）和street_name上的索引； 至于csv文件，我不知道是新条目还是旧条目，但是我知道大多数条目已经在数据库中，这将需要我更新上次观察的日期。 其余的将以观察到的最后日期为今天插入。 这样做可以帮助区分不再营业的餐厅（在这种情况下，“ lastdayobserved”列将不会更新）和当前营业的餐厅，该餐厅的日期应始终与今天的日期匹配。 也可以接受更有效的模式建议。 谢谢大家！

Answer 1

sql中有一个称为批量插入的函数，可以处理大量数据：

bulk insert #temp
from "file location path"

Answer 2

如果可以更改postgres设置，则可以利用Postgres中的并行性。 否则，您至少可以使用Postgres的批量上传（也称为COPY命令）来加快csv的上传速度。

没有更多细节，很难给出更好的建议。

在postgres中增加3亿个条目的最佳方法？

问题描述

2 个解决方案

解决方案1
1 2019-07-22 01:49:28

解决方案2
0 2019-07-22 01:56:13

在postgres中增加3亿个条目的最佳方法？

问题描述

2 个解决方案

解决方案1 1 2019-07-22 01:49:28

解决方案2 0 2019-07-22 01:56:13

解决方案1
1 2019-07-22 01:49:28

解决方案2
0 2019-07-22 01:56:13