簡體   English   中英

如何在 Azure 數據湖增量數據的數據塊中運行 python 腳本

[英]How to run a python script in databricks on Azure datalake delta data

我有一個用 azure 數據塊編寫的 python 腳本,用於對“.txt”格式的原始文本文件進行 ETL,並且沒有存儲在 Azure datalake V2 中的模式我使用數據工廠從本地虛擬機遷移了這些文本文件。 我的要求是僅在遷移到 Azure 數據湖的新數據(增量數據)上運行 python 腳本。 我怎樣才能實現它?

您可以嘗試使用 azure function blob 觸發器或使用事件網格觸發器並將“blob created”設置為條件。 然后把ETL邏輯放到function的body里面。

這是官方文檔:

https://docs.microsoft.com/en-us/azure/azure-functions/functions-bindings-storage-blob-trigger?tabs=csharp

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM