[英]Google Cloud Dataflow (Python): function to join multiple files
我是Google雲的新手,並且知道python可以編寫一些腳本,目前正在學習雲功能和BiqQuery。
我的問題:我需要將一個大型CSV文件與多個查找文件合並,並替換查找文件中的值。
了解到數據流可用於執行ETL,但不知道如何用Python編寫代碼。
您能否分享您的見解。 感謝您的幫助。
建議您不要提取並加載CSV和查找數據,而不要使用python連接數據。 然后運行一個BigQuery查詢,該查詢將數據聯接起來並將結果寫入永久表 。 然后,您可以刪除單獨導入的數據。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.