簡體   English   中英

何時使用 BigTableIO.write() API 與 CloudBigtableIO.CloudBigtableSingleTableBufferedWriteFn API

[英]when to use BigTableIO.write() API vs CloudBigtableIO.CloudBigtableSingleTableBufferedWriteFn API

我看到有兩個 API 可用於寫入 GCP BigTable : BigTableIO.write()CloudBigtableIO.CloudBigtableSingleTableBufferedWriteFn 我正在研究數據流管道,以從一個 BigTable 讀取數據並將處理后的輸出存儲在另一個 BigTable 中。 處理負載很大 - 10TB。

我想知道根據將大型數據集寫入 BigTable 的要求使用哪個 API。

根據您的用例,強烈建議您使用CloudBigTableIO API,因為您正在編寫Dataflow管道。 BigtableIO類來自 Beam SDK,而CloudBigtableIO類來自 Google。

CloudBigTableIO的一些優勢包括:

  • 有據可查的 HBase API
  • 讀取非常大的表格時效率更高
  • 更高效地將 Pub/Sub 作為來源
  • 輕松創建自定義 DoFns

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM