簡體   English   中英

無法將 Blob 存儲文件讀入 Azure ML Notebook

[英]Trouble reading Blob Storage File into Azure ML Notebook

我有一個 Excel 文件上傳到我的 ML 工作區。

我可以將文件作為 azure FileDataset object 訪問。但是,我不知道如何將它放入 pandas DataFrame,因為“FileDataset”object 沒有屬性“to_dataframe”。

Azure 出於某種原因,ML 筆記本似乎特別注意避免使用 pandas。

有誰知道如何從 Azure ML 筆記本中將 blob 文件放入 pandas 數據幀?

要探索和操作數據集,必須首先將其從 blob 源下載到本地文件,然后可以將其加載到 pandas DataFrame 中。

以下是此過程要遵循的步驟:

  1. 使用 Blob 服務使用以下 Python 代碼示例從 Azure blob 下載數據。 將以下代碼中的變量替換為您的特定值:

     from azure.storage.blob import BlobServiceClient import pandas as pd STORAGEACCOUNTURL= <storage_account_url> STORAGEACCOUNTKEY= <storage_account_key> LOCALFILENAME= <local_file_name> CONTAINERNAME= <container_name> BLOBNAME= <blob_name> #download from blob t1=time.time() blob_service_client_instance = BlobServiceClient(account_url=STORAGEACCOUNTURL, credential=STORAGEACCOUNTKEY) blob_client_instance = blob_service_client_instance.get_blob_client(CONTAINERNAME, BLOBNAME, snapshot=None) with open(LOCALFILENAME, "wb") as my_blob: blob_data = blob_client_instance.download_blob() blob_data.readinto(my_blob) t2=time.time() print(("It takes %s seconds to download "+BLOBNAME) % (t2 - t1))
  2. 從下載的文件中將數據讀入一個pandas DataFrame。

     #LOCALFILE is the file path dataframe_blobdata = pd.read_csv(LOCALFILENAME)

有關更多詳細信息,您可以點擊此鏈接

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM