[英]Migrate data from on-prem DW to Azure
我有一个使用SQL Server的本地Dat Warehouse,将数据加载到SQL Data Warehouse的最佳方法是什么?
The process of loading data depends on the amount of data. 加载数据的过程取决于数据量。 For very small data sets (<100 GB) you can simply use the bulk copy command line utility (bcp.exe) to export the data from SQL Server and then import to Azure SQL Data Warehouse.
对于非常小的数据集(<100 GB),您可以简单地使用批量复制命令行实用程序(bcp.exe)从SQL Server导出数据,然后导入到Azure SQL数据仓库。 For data sets greater than 100 GB, you can export your data using bcp.exe, move the data to Azure Blob Storage using a tool like AzCopy , create an external table (via TSQL code) and then pull the data in via a Create Table As Select (CTAS) statement.
对于数据集大于100 GB,则可以使用导出的Bcp.exe您的数据,移动使用类似的工具将数据Azure的Blob存储AzCopy ,创建外部表(通过TSQL代码),然后通过拉数据创建表作为选择(CTAS)语句。
Using the PolyBase/CTAS route will allow you to take advantage of multiple compute nodes and the parallel nature of data processing in Azure SQL Data Warehouse - an MPP based system. 使用PolyBase / CTAS路由将使您能够利用多个计算节点以及Azure SQL数据仓库(基于MPP的系统)中数据处理的并行性。 This will greatly improve the data ingestion performance as each compute node is able to process a block of data in parallel with the other nodes.
由于每个计算节点都可以与其他节点并行处理数据块,因此这将大大提高数据摄取性能。
One consideration as well is to increase the amount of DWU (compute resources) available in SQL Data Warehouse at the time of the CTAS statement. 还有一个考虑因素是在CTAS语句时增加SQL数据仓库中可用的DWU(计算资源)量。 This will increase the number of compute resources adding additional parallelism which will decrease the total ingestion time.
这将增加计算资源的数量,并添加其他并行性,这将减少总摄取时间。
SQL database migration wizard is a helpful tool to migrate schema and data from an on-premise database to Azure sql databases. SQL数据库迁移向导是将架构和数据从本地数据库迁移到Azure sql数据库的有用工具。 http://sqlazuremw.codeplex.com/
http://sqlazuremw.codeplex.com/
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.