繁体 English 中英

使用Apache Flume将日志从MapReduce作业写入HDFS

[英]Using Apache Flume to write logs from MapReduce job into HDFS

原文 2014-04-14 18:59:01 5 1 java/ hadoop/ log4j/ hdfs/ flume

我正在尝试将MapReduce作业的日志写入HDFS。 我正在使用Apache Flume NG。

我的环境：

Java 6
Log4j 1.2.16
Apache Hadoop 2.3.0
Apache Flume 1.4.0

问题1

我已经将简单的MapReduce作业创建为Maven项目，并且在类中使用了logger.info() 。 工作完成后，我可以在syslog文件中看到我的日志。

我想创建自己的log4j配置并将日志也写入控制台。 我怎样才能做到这一点？ 我必须在哪里放置log4j.properties文件？ 我应该修改常规的Hadoop conf / log4j.properties吗？

问题二

我想将日志写入HDFS。 但是我不想使用tail -f命令并写入syslog文件的内容。 我只想从我的类写日志-来自logger.info()方法的消息。

使用Apache Flume NG有可能吗？ 也许我可以更轻松地做到这一点？

我有一个想法在log4j.properties中实现Flume Log4j Appender（例如在localhost，44444端口上）。 在Flume NG配置中，我想对Avro源使用相同的地址，并通过内存通道将日志写入HDFS。

这是好的解决方案吗？

1 个解决方案

问题1

哪个控制台？ 请记住，任务在不同的JVM上运行。 因此，没有单个控制台。 如果要从驱动程序中获取日志，那将是简单的配置。

问题二

您尝试的通常是一个很好的解决方案。 Flume Appender在log4j项目中可用： Log4J 2 Flume Appender

1 ： http : //logging.apache.org/log4j/2.x/manual/appenders.html#FlumeAppender或其他选项： Kite SDK

无法使用水槽写入远程HDFS

[英]Cannot write from into remote HDFS using flume

如何从Mapreduce作业查询存储在hdfs中的嵌入式数据库？

[英]How to query an embedded database stored in hdfs from a Mapreduce job?

将Hadoop MapReduce作业中的数据写入MySQL

[英]Write data from Hadoop MapReduce job into MySQL

在HDFS上使用NIO进行mapreduce

[英]mapreduce using NIO on HDFS

编写一个空的MapReduce作业

[英]Write an empty MapReduce job

通过 Apache Flume 将日志文件从本地文件系统移动到 HDFS 时出错

[英]Error in moving log files from local file system to HDFS via Apache Flume

反序列化Json文件并使用Flume将其沉入HDFS

[英]Deserializing Json file and sink into HDFS using flume

从Java API获取mapreduce作业结果，而无需在HDFS上永久存储

[英]Getting mapreduce job result from Java API without permanent storage on HDFS

在Java MapReduce作业中写入Hive

[英]Write to Hive in Java MapReduce Job

如何使用Apache Spark将日志写入文件

[英]How to write logs in a file using apache spark

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 无法使用水槽写入远程HDFS 如何从Mapreduce作业查询存储在hdfs中的嵌入式数据库？将Hadoop MapReduce作业中的数据写入MySQL 在HDFS上使用NIO进行mapreduce 编写一个空的MapReduce作业通过 Apache Flume 将日志文件从本地文件系统移动到 HDFS 时出错反序列化Json文件并使用Flume将其沉入HDFS 从Java API获取mapreduce作业结果，而无需在HDFS上永久存储在Java MapReduce作业中写入Hive 如何使用Apache Spark将日志写入文件

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM