[英]Hadoop streaming cannot access jar archive
我正在运行此hadoop流命令:
/home/hduser/hadoop/bin/hadoop jar
/home/hduser/hadoop/share/hadoop/tools/lib
/hadoop-*streaming*.jar
-file audio.py
-cacheArchive hdfs://localhost:54310/user/hduser
/input/audio/cacheaudiodir.jar#cacheaudiodir
-input /user/hduser/input/audio -output /user/hduser/output
-mapper audio.py -cmdenv AUDIO_DIR=cacheaudiodir
当我尝试在Python映射器中引用“ cacheaudiodir”时,出现错误: No such file or directory
,例如:
dir_a='cacheaudiodir'
filelist_a = commands.getoutput('/home/hduser/hadoop/bin/hadoop fs -ls ' + dir_a)
如何指向此symlink文件夹中的文件?
似乎cachearchive在本地是未解压缩的,而不是在hdfs中,因此'hadoop fs -ls'找不到任何东西,而'ls'却找到了。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.