![](/img/trans.png)
[英]Copy Files from a folder to multiple folders based on the file name in Azure Data Factory
[英]Azure Data Factory- Copy specific files from multiple Parent folders from FTP Server
我試圖將.ZIP文件從FTP服務器復制到Azure DataLake。 我需要從特定的父文件夾中復制特定文件(總共我在FTP中有6個父文件夾),並且需要安排此管道。 那么我應該如何提供參數,以便管道應該只選擇不同文件夾中的特定文件?
我已經使用了元數據活動並試圖創建管道,但不知道如何提供管道來只選擇特定的文件!
Azure Data Factory支持在復制期間壓縮/解壓縮數據。 在輸入數據集中指定壓縮屬性時,復制活動從源讀取壓縮數據並解壓縮; 當您在輸出數據集中指定屬性時,復制活動壓縮然后將數據寫入接收器。
例如:
從FTP服務器讀取.zip文件,解壓縮以獲取文件,並將這些文件放在Azure Data Lake Store中。 您將壓縮類型屬性定義為ZipDeflate的輸入FTP數據集。
有關詳細信息,請參閱: 壓縮支持 。
以下是使用Azure Data Factory從FTP服務器復制數據的教程。
其他格式數據集要以ORC / Avro / JSON /二進制格式從FTP復制數據,此鏈接支持以下屬性: 其他格式數據集 。
提示:
希望這可以幫助。
您需要使用過濾器活動來僅過濾所需的文件夾/文件。 我想你需要2個循環:
循環1:獲取文件夾的元數據 - >過濾所需的文件夾 - >帶循環2的foreach管道循環2:獲取文件文件的元數據 - >過濾所需文件 - >復制所需文件
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.