[英]Backup ADLS gen2
我有數據湖和數據倉庫,其中包含 Azure ADLS gen2、CSV 和 Delta 格式的大約 5-10 TB 數據。 ADLS 的 Performance/Tier=Standard/Hot,replication=GRS,type=StorageV2。
備份我的 ADLS gen2 數據的最佳方法是什么?
注意事項:
data_container
掛載到 DBFS 中的archive_container
,並嘗試使用 Databrick 的dbutils.fs.cp
復制數據比 Azure 更慢 存儲資源管理器:3GB/10 分鍾,大 10 notes 30 DBU 集群。 為什么?對於原始數據/文件夾備份,我使用 Microsoft 數據移動服務將 blob 目錄從 ADLS Gen2 復制到存儲帳戶中。
為此,每天創建一個時間觸發器 function 來執行 blob 目錄的增量復制。 您可以配置這樣的東西。
使用每個星期一(日期)完整備份創建一個新文件夾,並將增量更改保留到星期日。 一個月后刪除舊的備份文件夾。
這是我的實現。
public async Task<string> CopyBlobDirectoryAsync(BlobConfiguration sourceBlobConfiguration, BlobConfiguration destBlobConfiguration, string blobDirectoryName)
{
CloudBlobDirectory sourceBlobDir = await GetCloudBlobDirectoryAsync(sourceBlobConfiguration.ConnectionString, sourceBlobConfiguration.ContainerName, blobDirectoryName);
CloudBlobDirectory destBlobDir = await GetCloudBlobDirectoryAsync(destBlobConfiguration.ConnectionString, destBlobConfiguration.ContainerName, destBlobConfiguration.BlobDirectoryPath + "/" + blobDirectoryName);
// You can also replace the source directory with a CloudFileDirectory instance to copy data from Azure File Storage. If so:
// 1. If recursive is set to true, SearchPattern is not supported. Data movement library simply transfer all azure files
// under the source CloudFileDirectory and its sub-directories.
CopyDirectoryOptions options = new CopyDirectoryOptions()
{
Recursive = true
};
DirectoryTransferContext context = new DirectoryTransferContext();
context.FileTransferred += FileTransferredCallback;
context.FileFailed += FileFailedCallback;
context.FileSkipped += FileSkippedCallback;
// Create CancellationTokenSource used to cancel the transfer
CancellationTokenSource cancellationSource = new CancellationTokenSource();
TransferStatus trasferStatus = await TransferManager.CopyDirectoryAsync(sourceBlobDir, destBlobDir, CopyMethod.ServiceSideAsyncCopy, options, context, cancellationSource.Token);
return TransferStatusToString(blobDirectoryName, trasferStatus);
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.