[英]Python Databricks: Is there any way to read text files inside a tar.gz folder saved in a blob storage?
我在 azure blob 存儲中的 tar.gz 文件夾中有一個.txt 文件。 有什么辦法可以在不解壓tar.gz文件夾的情況下讀取azure數據塊中.txt文件的內容嗎?
感謝DKNY分享您的寶貴建議。 發布與答案相同的內容以幫助其他社區成員。
使用數據塊執行所需的操作
%sh find $source -name *.tar.gz -exec tar -xvzf {} -C $destination \;
import os
os.environ[' source '] = '/dbfs/mnt/dl/raw/source/'
DF = spark.read.format('csv').options(header='true', inferSchema='true').option("mode","DROPMALFORMED").load('/mnt/dl/raw/source/sample.txt')
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.