繁体   English   中英

在 Azure 上的数据湖中的增量表中创建了多少个版本

[英]How many versions are created in a delta table in a Data lake on Azure

我有一个澄清问题。 根据我的阅读,Delta 表创建 0——原始数据,1——表中一行的更新数据版本。

所以基本上我们在 Delta 表中只有两个版本的数据,或者这是可配置的? 会发生什么,当我们多次更新同一行时,增量表只保留最新版本的更新?

提前致谢。

Delta 将为每个操作创建一个新版本 - 插入/更新/删除,以及其他操作,如更改表的属性、优化、真空等,尽管有些操作不会创建新文件(更新表属性) ,甚至删除不使用的文件(真空)。

请注意,Delta 中的数据文件是不可变的,当您更新或删除数据时,Delta 会识别哪些文件包含要更新/删除的数据,并使用修改后的数据创建新文件。 这就是定期运行 VACUUM 很重要的原因,这样您就可以摆脱旧文件(尽管它会限制您在给定时间段内进行时间旅行的能力 - 默认为一周)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM