google-cloud-platform - Google Cloud Dataflow 和 Google Cloud Dataproc 有什么區別？

雲數據流

是一種無服務器數據處理服務，運行使用 Apache Beam 庫編寫的作業。

當您在 Cloud Dataflow 上運行作業時，它的操作方式如下：

它啟動了一個虛擬機集群

將作業中的任務分配給虛擬機，並根據作業的執行情況動態擴展集群

Dataflow甚至可以更改處理管道中的操作順序以優化您的工作。

它支持批處理和流式作業。 所以用例是各種數據源/數據庫之間的 ETL（提取、傳輸、加載）作業。

例如，將大文件從 Cloud Storage 加載到 Big Query 中。

Streaming 基於對 Pub-Sub 主題的訂閱工作，因此您可以收聽實時事件（例如來自某些 IoT 設備的事件），然后進一步處理數據。

數據流的一個有趣的具體用例是數據准備。

數據准備是 GCP 上的一個雲工具，用於探索、清理和整理（大型）數據集。 當您定義要對數據執行的操作（如格式化、連接等）時，作業會在Dataflow上運行。

Cloud Dataflow還提供了基於“模板”創建作業的能力，這有助於簡化常見任務，其中差異在於參數值。

數據處理

是一種托管 Spark 和 Hadoop 服務，可讓您利用開源數據工具進行批處理、查詢、流式處理和機器學習。

數據處理自動化可幫助您快速創建集群、輕松管理它們，並通過在不需要時關閉集群來節省資金。 由於花在管理上的時間和金錢更少，您可以專注於工作和數據。

從 Google Cloud Dataproc 訪問 Cassandra

[英]Accessing Cassandra from Google Cloud Dataproc

計算谷歌雲 function 上的時間戳之間的差異

[英]Calculate the difference between timestamp on google cloud function

Google Cloud Dataflow 中的批處理與流式處理性能

[英]Batch vs Streaming Performance in Google Cloud Dataflow

了解 Google Cloud DataFlow Worker 中的線程

[英]Understanding Threading in Google Cloud DataFlow Workers

谷歌雲：Dataproc 啟動瀏覽器的時間太長

[英]Google cloud: Dataproc taking too long to start the explorer

Cloud Build 和 Cloud Deploy 有什么區別？

[英]What is the difference between Cloud Build and Cloud Deploy?

訪問 PCollectionView 的元素<list<foo> >: 谷歌雲數據流/Apache Beam </list<foo>

[英]Access elements of PCollectionView<List<Foo>> : Google Cloud Dataflow/Apache Beam

無法在 Google Cloud Dataflow 虛擬機中使用 ping 命令？

[英]Can't use ping command in Google Cloud Dataflow vm?

在 Beam/Google Cloud Dataflow 上調試慢速 PyTorch GPU 推理管道

[英]Debugging a slow PyTorch GPU Inference Pipeline on Beam/Google Cloud Dataflow

如何使用自定義 Docker 圖像運行 Python Google Cloud Dataflow 作業？

[英]How to run a Python Google Cloud Dataflow job with a custom Docker image?

Google Cloud Dataflow 和 Google Cloud Dataproc 有什么區別？

問題描述

7 個解決方案

解決方案1
61 2017-09-27 00:44:46

解決方案2
38 2018-10-22 11:36:55

解決方案3
11 2017-09-26 23:16:44

解決方案4
2 2019-07-02 02:08:24

解決方案5
1 2020-04-02 15:28:24

解決方案6
1 2021-01-23 13:20:53

解決方案7
0 2022-12-12 10:12:00

雲數據流

數據處理

解決方案8
-1 2021-12-04 19:42:42

Google Cloud Dataflow 和 Google Cloud Dataproc 有什么區別？

問題描述

7 個解決方案

解決方案1 61 2017-09-27 00:44:46

解決方案2 38 2018-10-22 11:36:55

解決方案3 11 2017-09-26 23:16:44

解決方案4 2 2019-07-02 02:08:24

解決方案5 1 2020-04-02 15:28:24

解決方案6 1 2021-01-23 13:20:53

解決方案7 0 2022-12-12 10:12:00