簡體   English   中英

Azure數據工廠 - 從FTP服務器復制多個父文件夾中的特定文件

[英]Azure Data Factory- Copy specific files from multiple Parent folders from FTP Server

我試圖將.ZIP文件從FTP服務器復制到Azure DataLake。 我需要從特定的父文件夾中復制特定文件(總共我在FTP中有6個父文件夾),並且需要安排此管道。 那么我應該如何提供參數,以便管道應該只選擇不同文件夾中的特定文件?

我已經使用了元數據活動並試圖創建管道,但不知道如何提供管道來只選擇特定的文件!

Azure Data Factory支持在復制期間壓縮/解壓縮數據。 在輸入數據集中指定壓縮屬性時,復制活動從源讀取壓縮數據並解壓縮; 當您在輸出數據集中指定屬性時,復制活動壓縮然后將數據寫入接收器。

例如:

從FTP服務器讀取.zip文件,解壓縮以獲取文件,並將這些文件放在Azure Data Lake Store中。 您將壓縮類型屬性定義為ZipDeflate的輸入FTP數據集。

有關詳細信息,請參閱: 壓縮支持

以下是使用Azure Data Factory從FTP服務器復制數據的教程。

其他格式數據集要以ORC / Avro / JSON /二進制格式從FTP復制數據,此鏈接支持以下屬性: 其他格式數據集

在此輸入圖像描述

提示:

  1. 要復制文件夾下的所有文件, 僅指定folderPath
  2. 要復制具有給定名稱的單個文件,請指定帶有文件夾部分的folderPath和帶有文件名的fileName
  3. 要復制文件夾下的文件子集,請指定帶有文件夾部分的folderPath和帶有通配符過濾器的fileName

希望這可以幫助。

您需要使用過濾器活動來僅過濾所需的文件夾/文件。 我想你需要2個循環:

循環1:獲取文件夾的元數據 - >過濾所需的文件夾 - >帶循環2的foreach管道循環2:獲取文件文件的元數據 - >過濾所需文件 - >復制所需文件

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM