简体   繁体   English

是否可以使用 Apache Beam / Google Cloud Dataflow 从 Azure EventHub 主题中使用?

[英]Is it possible to consume from an Azure EventHub topic using Apache Beam / Google Cloud Dataflow?

Problem问题

We'd like to consume from an EventHub topic in Azure using a dataflow pipeline in Google Cloud.我们想使用 Google Cloud 中的数据流管道从 Azure 中的 EventHub 主题进行消费。

Question

Is it known whether KafkaIO allows for consuming from EventHubs directly in an Apache Beam/Google Cloud dataflow job?是否知道 KafkaIO 是否允许在 Apache Beam/Google Cloud 数据流作业中直接从 EventHub 进行消费? (see this post ) (见这个帖子

Alternative approaches for getting the EventHub data into Pub/Sub are also appreciated (eg Publish from Azure Streaming Analytics to Pub/Sub)将 EventHub 数据导入 Pub/Sub 的替代方法也很受欢迎(例如从 Azure 流分析发布到 Pub/Sub)

Thank you!谢谢!

Azure Event Hubs supports the Apache Kafka protocol 1.0 and later , so you should be able to consume events from Event Hubs using KafkaIO (which supports Kafka versions 0.10.1 and newer). Azure 事件中心支持Apache Kafka 协议 1.0 和更高版本,因此您应该能够使用KafkaIO (支持 Kafka 版本 0.10.1 和更高版本)使用来自事件中心的事件。 Google Cloud has a guide for processing messages from Kafka in Dataflow here . Google Cloud 在此处提供了在 Dataflow 中处理来自 Kafka 的消息的指南。

Azure 事件中心与 Kafka 协议二进制兼容,因此任何 Kafka 客户端或管道都应该能够使用来自事件中心主题的事件。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Google Cloud上的Apache Beam数据流 - Apache beam on google cloud dataflow 是否可以在 Apache 光束或谷歌云数据流中运行自定义 python 脚本 - Is it possible to run a custom python script in Apache beam or google cloud dataflow 使用 apache 梁/谷歌云数据流读取多行 JSON - Read multiline JSON using apache beam / google cloud dataflow 使用 Google Cloud Dataflow 在 Apache Beam 中进行 Json 验证 - Json Validation in Apache beam using Google Cloud Dataflow Google Cloud Dataflow如何使用Apache Beam从BigQuery读取数据? - How does google cloud Dataflow read from BigQuery using apache beam? 使用 Dataflow + Beam + Python 从 Google Cloud Storage 读取 Shapefile - Read Shapefile from Google Cloud Storage using Dataflow + Beam + Python 一旦使用 apache 光束 sdk 在 Google Cloud 中创建数据流作业,我们可以从云存储桶中删除 tmp 文件吗? - Once dataflow job is created in Google Cloud using apache beam sdk, can we delete the tmp files from cloud storage bucket? Google DataFlow Apache Beam - Google DataFlow Apache Beam Apache Beam / Google Dataflow-将数据从Google数据存储导出到Cloud Storage中的文件 - Apache Beam/Google Dataflow - Exporting Data from Google Datastore to File in Cloud Storage 如何在Google Cloud Dataflow / Apache Beam中并行运行多个WriteToBigQuery? - How to run multiple WriteToBigQuery parallel in google cloud dataflow / apache beam?
 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM