繁体   English   中英

Flume 代理从 Kafka 读取数据并以 parquet 格式存储数据

[英]Flume agent reading from Kafka and storing data in parquet format

我想配置一个应该从 Kafka 主题读取的 Flume 代理,并以 Parquet 格式保存数据。 我该怎么做? 我找不到直接以 Parquet 格式写入数据的解决方案

Flume HDFS sink 默认不会写入 parquet,因为你不能 append 行到它。 最好是使用 Flume 编写 avro 文件,并在文件完成时触发 MapReduce 作业或 Impala 以执行 Avro to Parquet。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM