[英]Dataflow Template/Pattern in enriching fixed BigQuery data by streaming Pubsub data
我有一個 BigQuery 維度表(變化不大)和來自 PubSub 的流式 JSON 數據。 我想要做的是查詢這個維度表,並通過加入來自 PubSub 的傳入數據來豐富數據,然后將這些加入的數據流寫入另一個 BigQuery 表。
由於我是 Dataflow/Beam 的新手,並且這個概念對我來說仍然不是很清楚(或者至少我開始編寫代碼有困難),所以我有很多問題:
ParDo.of(...).withSideInputs(PCollectionView<Map<String, String>> map)
?您需要加入兩個 PCollection。
PeriodicImpulse
和您自己的ParDo
來創建周期性變化的輸入。 有關示例,請參見此處(請注意,最近添加了PeriodicImpulse
變換)。 您可以在ParDo
中組合數據,其中PCollection
(1) 是主要輸入, PCollection
(2) 是輔助輸入(類似於上面的示例)。
最后,您可以使用BigQueryIO.Write轉換將 stream output 轉換為 BigQuery。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.