繁体   English   中英

从 Azure SQL 数据库迁移到 Azure Synapse

[英]Moving to Azure Synapse from Azure SQL Database

我们目前正在将应用程序数据库中的数据引入 Azure SQL 数据库。 现在的大小大约是 600 GB(主要分布到只有 3 个事实表,其余的表是主数据,非常小)并且它在 40 个 vCore 上运行(我们经常使用它来报告,所以需要很大的数字) vCore 数量)。

我目前面临的一些困难:

  1. 从源到接收器的数据复制通常需要很长时间。 我们使用的方法是delete本月的所有记录,然后copy本月的数据从应用程序数据库中copy过来。 写入 sink 通常也需要很多时间(由于我相信事实表上的索引)。

  2. 每当有人提出大查询时,数据 I/O 就很高。

在这里希望有人可以阐明如何使设置工作得更快。

谢谢!

虽然我需要更多信息,但我想我可以分享一些建议。 当您提到需要更多时间的大查询时,您是否检查过查询并确保索引位于所需的列上并且它们定期更新?看起来您有 3 个包含大量数据的表,查询是不是很慢?在所有三个方面?(如果我是你,我会尝试将问题分成更小的问题并调查每个问题)

在复制部分,在复制之前,您必须选择数据,因此我们必须改进我上面提到的查询性能。 你是如何复制数据的? 因为我看到 ADF 标签,所以我假设它的 ADF 。 您是否按顺序复制数据? 我的意思是将数据复制到 BigTable1 然后复制 BigTable2 然后 BigTable 3 ? 您可以探索并行复制数据的可能性。 我不确定你是如何在 ADF 中实现逻辑的,但是三个副本 avtivity 一个在另一个下面会起作用。

在每个复制活动中,您都可以选择设置并行度和批次计数,我建议您查看一下。

除非您有权访问数据,否则很难解决性能问题:) 让我知道它是怎么回事。

https://docs.microsoft.com/en-us/azure/data-factory/copy-activity-performance-features#parallel-copy

谢谢

喜满树

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM