繁体   English   中英

Hadoop流无法访问jar存档

[英]Hadoop streaming cannot access jar archive

我正在运行此hadoop流命令:

/home/hduser/hadoop/bin/hadoop jar
/home/hduser/hadoop/share/hadoop/tools/lib
/hadoop-*streaming*.jar 
-file audio.py 
-cacheArchive        hdfs://localhost:54310/user/hduser
  /input/audio/cacheaudiodir.jar#cacheaudiodir 
-input /user/hduser/input/audio -output /user/hduser/output
-mapper audio.py -cmdenv AUDIO_DIR=cacheaudiodir

当我尝试在Python映射器中引用“ cacheaudiodir”时,出现错误: No such file or directory ,例如:

dir_a='cacheaudiodir'
filelist_a = commands.getoutput('/home/hduser/hadoop/bin/hadoop fs -ls ' + dir_a)

如何指向此symlink文件夹中的文件?

似乎cachearchive在本地是未解压缩的,而不是在hdfs中,因此'hadoop fs -ls'找不到任何东西,而'ls'却找到了。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM