[英]Nutch : org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist
[英]Exception in thread “main” org.apache.hadoop.mapreduce.lib.input.InvalidInputException:Input path does not exist: hdfs:host/user/yogesh/WordCount
hadoop jar /home/yogesh/WordCount.jar WordCount /user/yogesh/Input/test.txt /user/yogesh/Output/output1
我遇到以下错误:
线程“main”中的异常
org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:hdfs:host / user / yogesh / WordCount。
hdfs:host / user / yogesh /-是我的HDFS目录。 我无法理解为什么此MR作业在HDFS中寻找代码以及如何解决此错误。
尝试给WordCount类的名称包作为其前缀,或者跳过该类,仅使用jar,input,output,如下所示:
hadoop jar /home/yogesh/WordCount.jar /user/yogesh/Input /user/yogesh/Output/output1
另外,在执行此命令之前,请确保/user/yogesh/Output/output1
不存在。 另外,请注意,您应该提供输入目录,而不是输入文件。 Hadoop将把指定目录中的所有文件作为输入。
有关示例,请在此站点上查看如何运行WordCount示例。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.