簡體   English   中英

Flume 代理從 Kafka 讀取數據並以 parquet 格式存儲數據

[英]Flume agent reading from Kafka and storing data in parquet format

我想配置一個應該從 Kafka 主題讀取的 Flume 代理,並以 Parquet 格式保存數據。 我該怎么做? 我找不到直接以 Parquet 格式寫入數據的解決方案

Flume HDFS sink 默認不會寫入 parquet,因為你不能 append 行到它。 最好是使用 Flume 編寫 avro 文件,並在文件完成時觸發 MapReduce 作業或 Impala 以執行 Avro to Parquet。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM