簡體   English   中英

使用 Azure 數據工廠處理 zip 文件

[英]Processing zip files using Azure Data Factory

在 Data Lake 中,我正在尋找有關如何處理的信息。zip 文件包含一個文件。 不確定我是否可以直接將 zip 文件中的內容處理到 Azure 數據庫中,而無需將內容解壓縮到單獨的文件夾中。

另一個問題是文本文件在 pipe 分隔符中的列數是可變的,因為單個文本文件包含來自多個表的數據。 不確定處理此可變列計數文本文件的可能方法是什么。

數據工廠支持讀取.zip文件中的文件/數據,我們可以為.zip文件設置壓縮類型,我們不需要將內容解壓縮到單獨的文件夾中。 請參見下面的示例: 在此處輸入圖像描述

對於您的另一個問題,如果文本文件在 pipe 分隔符中具有可變的列數。 數據工廠不能很好地處理這種文件,它總是會根據列分隔符編號將第一行視為架構。 就目前而言,沒有很好的方法來處理它。

HTH。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM