![](/img/trans.png)
[英]Is there a CloudFormation template for DC/OS, ElasticSearch, Kafka Connect and Kafka Streams?
[英]Kafka to Elasticsearch, HDFS with Logstash or Kafka Streams/Connect
我使用Kafka进行消息队列/处理。 我的问题是关于绩效/最佳实践。 我会做自己的性能测试,但也许有人已经有了成绩/经验。
数据是Kafka(0.10)主题中的原始数据,我想将其结构化为ES和HDFS。
现在我看到两种可能性:
没有任何测试,我会说第二种选择更好/更清洁,更可靠?
Logstash将数据导入Elasticsearch的“最佳实践”。 但是,WebHDFS不具备作为Kafka Connect插件一部分的Java API的原始性能。
Grok可以在Kafka Streams过程中完成,因此您可以在任一位置完成解析。
如果您使用Elastic订阅,那么他们想要销售Logstash。 Confluent想要出售Kafka Streams + Kafka Connect。
Avro似乎是数据传输的最佳媒介,Schema Registry是一种流行的方式。 IIUC,Logstash与Schema Registry或Avro不兼容,并且更喜欢JSON。
在Hadoop环境中,我将提供Apache Nifi或Streamsets的中间选项。
最后,它实际上取决于您的优先级,以及您(以及您的团队)对这些工具的支持程度。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.