繁体   English   中英

如何使用参数文件将多个文件从 BLOB 导出为 Azure Synapse Analytics 中的 Data Lake Parquet 格式?

[英]How to Export Multiple files from BLOB to Data lake Parquet format in Azure Synapse Analytics using a parameter file?

我正在尝试将 multiples.csv 文件从 blob 存储导出到 Azure 基于参数文件的 Parquet 格式的数据湖存储,使用 ADF -for each 迭代 blob 中的每个文件并复制活动以从 src 复制到接收器(已尝试使用元数据和每个活动),因为我是 Azure 的新手,有人可以帮我实现一个将在复制活动中使用的参数文件。 非常感谢

如果是这样。 我创建了简单的测试:

  1. 我有一个 paramfile 包含稍后将复制的文件名。
    在此处输入图像描述

  2. 在 ADF 中,我们可以对参数文件使用Lookup活动。 在此处输入图像描述 数据集如下: 在此处输入图像描述 Lookup活动的output如下:
    在此处输入图像描述

  3. ForEach活动中,我们应该添加动态内容@activity('Lookup1').output.value 它将 foreach Lookup活动的输出数组。
    在此处输入图像描述

  4. ForEach活动中,在源选项卡中,我们需要 select Wildcard file path并在通配符路径中添加动态内容@item().Prop_0 在此处输入图像描述

就这样。

我认为您是在询问如何循环遍历多个文件并将所有相似文件合并到一个数据帧中,因此您可以将其推送到 SQL Server Synapse 中。 那正确吗? 您可以通过将通配符放在相似文件的路径中来遍历 Lake 中的文件。

复制活动仅选取具有已定义命名模式的文件,例如“*2020-02-19.csv”或“???20210219.json”。

有关详细信息,请参阅下面的链接。

https://azure.microsoft.com/en-us/updates/data-factory-supports-wildcard-file-filter-for-copy-activity/

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM