[英]How to handle deleted records (from source) in the Data Vault model?
我们正在构建一个Data Vault (2.0)
模型来捕获 SalesForce 数据。 像许多其他来源一样,来源中的记录被软删除。 当我们为数据模型提供数据时,我们不想过滤任何数据,也不想捕获目标系统中已删除的记录。 搜索了在 Data Vault 模型中处理已删除记录的最佳实践,但没有成功。 有人可以在这里放一些灯吗? 考虑到模型的未来扩展和要遵循的最佳设计实践,我们是否应该在Hub
或Satellite
添加IsDeleted
标志。 此外,这里的任何参考资料链接都会有很大帮助。 谢谢你。
在 DV2.0 规范中,有一个“记录源跟踪卫星”,它完全按照您的意愿执行操作,跟踪每个源的插入、更新和删除记录(如果您有这本书,则为第 143 页)。
基本上,这是一个带有哈希键、加载日期、记录源和状态 (I/U/D) 的卫星。 每次在源系统中添加、更新或删除记录时,您都会插入一条记录。
在 DV1.0 中,有一个“last seen”字段,但由于性能问题已被删除( https://danlinstedt.com/allposts/datavaultcat/end_of_updates/ )
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.