[英]Airflow BigQuery Operator - Copying One Table to Another Table
使用 Airflow 中的 BigQueryOperator,如何将一个 BigQuery 表(具有所有字符串的架构)复制到另一个 BigQuery 表(具有字符串、整数和浮点数的架构)? 请注意,table_1 和 table_2 已在 BigQuery 中使用以下架构创建,table_1 和 table_2 的架构不应更改。
table_1 具有以下架构和数据:
Column_1 (string) Column_2 (string) Column_3 (string) Column_4 (string) Column_5 (string)
ABC 1 1 1.5 1
DEF 2 2 2.5 2
HIJ 3 3 3.5 3
table_2 具有以下架构和数据:
Column_1 (string) Column_2 (integer) Column_3 (integer) Column_4 (float) Column_5 (integer)
ABC 1 1 1.5 1
DEF 2 2 2.5 2
HIJ 3 3 3.5 3
为完成此任务,我尝试使用以下 BigQueryOperator,但收到错误消息“查询列 2 的类型为 STRING,无法插入到列 Column_2,其类型为 INT64”。
BigQuery_Task = BigQueryOperator(
task_id = "Copy_To_New_Table",
sql = "INSERT `gcp_project.gcp_dataset.table_2` (Column_1, Column_2, Column_3, Column_4, Column_5) SELECT Column_1, Column_2, Column_3, Column_4, Column_5 FROM `gcp_project.gcp_dataset.table_1`",
write_disposition = "WRITE_TRUNCATE",
location = "US",
bigquery_conn_id = "conn_id",
use_legacy_sql = False,
dag = dag)
首先,删除这部分调用:
destination_dataset_table = "gcp_project.gcp_dataset.table_1
然后编写将运行的 SQL 命令。 BigQuery 通常需要显式转换:
INSERT `gcp_project.gcp_dataset.table_2` (Column_1, Column_2, Column_3, Column_4, Column_5)
SELECT CAST(Column_1 as int64),
CAST(Column_2 as int64) as Column_2,
CAST(Column_3 as int64) as Column_3,
CAST(Column_4 as int64) as Column_4,
CAST(Column_5 as int64) as Column_5
FROM `gcp_project.gcp_dataset.table_1`"
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.