繁体 English 中英

Azure 数据工厂管道中的批处理

[英]Batch Processing in Azure Data Factory Pipelines

原文 2021-12-01 06:35:51 4 2 azure/ azure-data-factory

我是 ADF 管道的新手。 我想从本地 loc 读取文件并以特定大小（2 GB）的批次复制到 ADLS。 例如，如果有 200 个文件，它将读取所有文件并将文件组（< 2GB）顺序传递给下一个进程/管道。 那么，如何在 ADF 中添加文件的大小？

2 个解决方案

您需要添加一个 If Condition 活动（在活动中搜索 If 条件）。 然后您需要获取要检查的文件的元数据。 在元数据中，您将获得文件的大小。

获取元数据的参考链接

获得元数据后，您可以根据文件大小条件添加批处理活动。

您可以通过多次调用 Get Metadata 活动来获取文件大小，这里有一个很好的例子来说明如何做到这一点。 使用Child Items字段时， Get Metadata活动不返回文件大小。 如果您指定单个文件，您可以获得Size 。 本地或云数据源的一些其他潜在方法，例如自定义活动 - 例如运行一些批处理命令，Web 活动 - 例如调用存储 api，笔记本 - 例如运行一些 Z23EEEB4347BDD26BFC6B7EE9A3B75

另一种方法是使用 Copy 活动的Max rows per file选项：

对于给定的表，您可以指定每个文件的最大行数，这将接近 2GB 文件大小，因此采用不同的方法但结果相同。

Azure数据工厂V2 Azure ML批量处理

[英]Azure data factory V2 Azure ML batch processing

在 Azure 数据工厂中编排管道

[英]Orchestrating Pipelines in Azure Data Factory

部署Azure Data Factory版本2管道

[英]Deployment of Azure Data Factory version2 Pipelines

Azure 数据工厂 - 查找非活动管道

[英]Azure data Factory - Find Inactive pipelines

Azure 数据工厂与 Synapse 工作区管道

[英]Azure Data Factory vs Synapse Workspace pipelines

Azure 数据工厂 - 非活动管道的成本

[英]Azure data factory - cost of inactive pipelines

比较两个 azure 数据工厂管道的基准

[英]Benchmarks to compare two azure data factory pipelines

如何链接 Azure 数据工厂管道

[英]How to chain Azure Data Factory pipelines

是否可以在 Azure 数据工厂管道中存储变量？

[英]Is it possible to store variables in Azure Data Factory pipelines?

动态Azure Data Factory v2管道

[英]Dynamic Azure Data Factory v2 pipelines

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Azure数据工厂V2 Azure ML批量处理在 Azure 数据工厂中编排管道部署Azure Data Factory版本2管道 Azure 数据工厂 - 查找非活动管道 Azure 数据工厂与 Synapse 工作区管道 Azure 数据工厂 - 非活动管道的成本比较两个 azure 数据工厂管道的基准如何链接 Azure 数据工厂管道是否可以在 Azure 数据工厂管道中存储变量？动态Azure Data Factory v2管道

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM