[英]Hadoop 2.7.3 Streaming Jar not valid
我是Hadoop的新手,并试图使用它来运行一个简单的程序。
我已将本地示例数据复制到hdfs,但在我的映射中减少作业,当我按照官方apache文档运行此命令时
hadoop jar hadoop-streaming-2.7.3.jar \
-input /user/hduser/gutenberg/* \
-output /user/hduser/gutenberg-output \
-mapper /home/hduser/mapper.py \
-reducer /home/hduser/reducer.py
我收到了这个错误
不是有效的JAR:/usr/lib/hadoop-streaming-2.7.3.jar
请尽力帮助我。
它正在与Hadoop 2.7.3一起使用
这是您需要运行的命令
[Linux]$ hadoop jar \
/usr/local/hadoop/share/hadoop/tools/lib/hadoop-streaming-2.7.3.jar \
-file /home/python/mapper.py /home/python/reducer.py \
-mapper "python mapper.py" \
-reducer "python reducer1.py" \
-input /tmp/word_i \
-output /tmp/word_output
hadoop-streaming-jar的位置:
$ HADOOP_HOME /股/ Hadoop的/ tools / lib目录/ Hadoop的流,2.7.1.2.4.2.0-258.jar
因为$ HADOOP_HOME有时不相同。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.