COPY INTO 带有额外列的雪花表

Question

我在雪花中定义了一个表：

GLPCT

BATCH_KEY NUMBER(38,0) NULL
CTACCT VARCHAR(100) NULL
CTPAGE NUMBER(38,0) NULL

和一个看起来像这样的文件：

GLPCT.csv

CTACCT VARCHAR(100)
CTPAGE NUMBER(38,0)

例子：

CTACCT,CTPAGE
"Test Account",100
"Second Account", 200

我的复制到命令如下所示：

copy into GLPCT_POC from 'azure://ouraccount.blob.core.windows.net/landing/GLPCT' credentials=(azure_sas_token='<SAS_TOKEN') file_format=(TYPE=CSV, SKIP_HEADER = 1, FIELD_OPTIONALLY_ENCLOSED_BY='"');

问题

由于列号不匹配，Snowflake 抛出错误。 如何让 Snowflake 忽略文件中不存在的列而不抛出错误？ 如果有帮助，我可以将BATCH_KEY移到表的末尾。

Answer 1

似乎可以使用 COPY INTO 语句指示要插入哪些列，因此我们的语句变为：

copy into GLPCT_POC (CTACCT, CTPAGE) from 'azure://ouraccount.blob.core.windows.net/landing/GLPCT' credentials=(azure_sas_token='<SAS_TOKEN') file_format=(TYPE=CSV, SKIP_HEADER = 1, FIELD_OPTIONALLY_ENCLOSED_BY='"');

由于这是一个外部文件，我们无法使用上一个答案中提到的转换。

Answer 2

Snowflake 允许您在文件格式中设置 ERROR_ON_COLUMN_COUNT_MISMATCH。

ERROR_ON_COLUMN_COUNT_MISMATCH = TRUE | FALSE 布尔值，指定如果输入数据文件中的分隔列（即字段）数与相应表中的列数不匹配，是否生成解析错误。

如果设置为 FALSE，则不会生成错误并继续加载。 如果文件加载成功：

如果输入文件包含的记录的字段数多于表中的列数，则匹配的字段将按文件中出现的顺序加载，而不加载其余字段。

如果输入文件包含的记录的字段数少于表中的列数，则表中不匹配的列将加载为 NULL 值。

https://docs.snowflake.com/en/sql-reference/sql/copy-into-table.html#type-csv

Answer 3

您可以在将数据与副本一起拉入查询时添加“转换”。 在这种情况下，您的转换可以是添加一个 NULL 列。

但是，为了使用此功能，您需要为外部源创建一个舞台

create or replace stage my_stage 
url='azure://ouraccount.blob.core.windows.net/landing/GLPCT'
credentials=(azure_sas_token='<SAS_TOKEN')
file_format=(TYPE=CSV, SKIP_HEADER = 1, FIELD_OPTIONALLY_ENCLOSED_BY='"');

copy into GLPCT_POC 
from (SELECT NULL, $1, $2 FROM @my_stage);

$1 和 $2 与文件中的列对齐，然后 select 子句中列的顺序与表中的列对齐。

这样做的额外好处是，如果您要重用该复制语句和/或阶段，则无需重复所有凭据和文件格式信息。

请参阅使用转换语法加载数据

COPY INTO 带有额外列的雪花表

问题描述

GLPCT

GLPCT.csv

问题

3 个解决方案

解决方案1
5 已采纳 2019-12-04 03:25:00

解决方案2
1 2020-08-12 15:41:33

解决方案3
0 2019-12-04 03:08:13

COPY INTO 带有额外列的雪花表

问题描述

GLPCT

GLPCT.csv

问题

3 个解决方案

解决方案1 5 已采纳 2019-12-04 03:25:00

解决方案2 1 2020-08-12 15:41:33

解决方案3 0 2019-12-04 03:08:13

解决方案1
5 已采纳 2019-12-04 03:25:00

解决方案2
1 2020-08-12 15:41:33

解决方案3
0 2019-12-04 03:08:13