繁体   English   中英

如何在 BIG QUERY 中创建具有增量负载的表

[英]How to create table with incremental load in BIG QUERY

我有一个 EMP 表,每天都会被 WRITE_TRUNCATE。 截断的数据与记录进入日期一起保存在名为 emp_hx 的历史表中。 像下面这样

实际和历史数据

但由于空间问题,我们只想维护“hx”表中更改的记录或新记录,这就像一种增量加载的表。 如何在 BIG QUERY 中实现此类表或如何实现 select 此类增量数据,

请指导我们。

预期 output 如下

预期 HX 表

你似乎想要:

select min(created_time) as created_time, empid, empname, sal
from emp_hx
group by empid, empname, sal;

您可以使用 row_number() 函数仅通过 created_time 拉取最新更新的行

BigQuery 合并命令可以完全按照Google BQ 的要求执行 - 如何将现有数据插入表中? 如今,所有现代数据湖都支持使用合并命令更新数据。 要检查语法,您可以参考 BigQuery 的合并命令部分: https://cloud.google.com/bigquery/docs/reference/standard-sql/dml-syntax

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM