簡體   English   中英

Apache 光束 HTTP 無界源 Python

[英]Apache Beam HTTP Unbounded Source Python

是否可以使用當前版本的 Apache Beam 開發一個無界源來接收 HTTP 消息中的數據? 我的意圖是運行 HTTP 服務器並將收到的消息注入 Beam 管道。 如果可能的話,可以用現有的資源來完成嗎?

有可能的。 您可以利用Splittable DoFn來開發它。來源看起來他們將在不久的將來貶值。

From my end, I am trying to develop such a pipeline that would consume a Rest API that is streaming Json messages in the get's body and supports multiple connections, hence splitting the workload on API side like Adobe Livestream or Twitter . 此行為應在消費者端啟用擴展(數據流)

我的掙扎是我無法從這個用例中找出一個可拆分的限制。 流是無限的,並且沒有像 Kafka 或字節范圍(文件)這樣的消息傳遞代理中的偏移量。 我想首先構建元素限制對,例如:(url,緩沖閱讀器),但我認為緩沖閱讀器不能拆分。

解決方案之一可能是根本不提供限制。 我很難想象管道將如何分配元素從而擴展。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM