[英]How can I tell Dataflow to "use_unsupported_python_version" with PipelineOptions?
[英]Can I use google DataFlow with native python?
我正在嘗試在谷歌雲中構建一個 python ETL 管道,而谷歌雲數據流似乎是一個不錯的選擇。 當我瀏覽文檔和開發人員指南時,我看到 apache beam 始終附加到數據流,因為它基於它。 我可能會在 apache beam 中發現處理我的數據幀的問題。
我的問題是:
我的管道旨在從 BigQuery 處理它讀取數據並將其重新保存在一個 bigquery 表中。 我可能會在我的腳本中使用一些外部 API。
關於你的第一個問題,Dataflow需要使用Apache Beam。 事實上,在 Apache Beam 之前,有一個叫做 Dataflow SDK 的東西,它是 Google 專有的,然后開源給 Apache Beam。
Python Beam SDK 是相當容易的,一旦你付出了一些努力,你需要的主要流程操作非常接近原生 Python 語言。
如果您的最終目標是讀取、處理和寫入 BQ,我會說 Beam + Dataflow 是一個很好的搭配。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.