繁体   English   中英

将 zip 文件解压缩到 Azure 数据工厂中的 zip 文件中

[英]Unzip zip files within a zip file in Azure Data Factory

情况是一个 zip 文件包含多个 zip 文件,我想在 ADF 中解压缩 2 层。 几乎所有的视频/指南只有一个 zip 文件需要解压,所以我不知道该怎么做。

当我解压缩外部 zip 文件时,文件夹中包含一个无用的二进制文件

Azure 数据工厂提供了多个用于处理 zip 文件的内置活动。 两个最常用的活动是:

复制活动:此活动可用于将文件或文件夹从源复制到目标。 执行命令活动:允许您将命令行作为管道的一部分执行。 为了在 ADF 中解压缩 zip 文件中的文件,您可以结合使用这两个活动:

使用 Copy 活动将外部 zip 文件复制到 blob 存储。 使用执行命令活动解压缩外部 zip 文件,这将生成一个包含内部 zip 文件的文件夹。 再次使用复制活动将内部 zip 文件复制到另一个位置。 使用执行命令活动解压缩内部 zip 文件,这将生成最终的解压缩文件。 您可以使用 7-zip 或 WinRar 等工具解压缩文件,但需要在运行数据工厂管道的计算机上安装这些工具。 或者,您也可以使用 PowerShell 脚本、azure function 活动来解压缩文件。

ADF目前不支持同时解压两级zip文件。 因此,您必须使用复制活动两次来解压缩子级 zip 文件,如下所示 - 使用二进制数据集。

在此处输入图像描述

为第一次复制活动的接收器提供临时文件夹。

在此处输入图像描述

然后使用 Get Meta 数据活动列出子项并将其提供给 ForEach 并在 ForEach 内部使用另一个复制活动。

在此处输入图像描述

对于此源,使用数据集参数并提供@item().name并在接收器二进制数据集中提供file_name.csv

在此处输入图像描述

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM