繁体 English 中英

Hadoop流作业执行中映射器的“文本文件繁忙”错误

[英]“Text file busy” error for the mapper in a Hadoop streaming job execution

原文 2014-09-21 20:21:13 4 1 python/ hadoop/ mapreduce/ streaming

我有一个创建文本文件的应用程序，每个文本文件只有一行，然后将其转储到hdfs。 该位置又被用作hadoop流作业的输入目录。

期望的是，映射程序的数量将等于“输入文件分割”，它等于我的情况下的文件数量。 某些未触发所有映射器的方式，我在流输出转储中看到一个奇怪的问题：

引起原因：java.io.IOException：无法运行程序“ /mnt/var/lib/hadoop/tmp/nm-local-dir/usercache/hadoop/appcache/application_1411140750872_0001/container_1411140750872_0001_01_000336/./CODE/python_mapper_unix.py”：错误= 26，文本文件忙

“ python_mapper.py”是我的映射器文件。

环境详细信息：一个40节点aws r3.xlarge AWS EMR集群[此集群上没有其他作业在运行]当此流媒体jar运行时，该集群上没有其他作业在运行，因此，任何外部进程都不应尝试打开“ python_mapper.py”文件

这是流jar命令：

ssh -o StrictHostKeyChecking =否-i hadoop @ hadoop jar /home/hadoop/contrib/streaming/hadoop-streaming.jar-文件CODE-文件CODE / congfiguration.conf -mapper CODE / python_mapper.py -input / user / hadoop / launchidlworker / input / 1-输出/ user / hadoop / launchidlworker / output / out1 -numReduceTasks 0

1 个解决方案

您能否先尝试使用“ stop-all”停止所有守护程序，然后在重新启动守护程序（使用“ start-all”）之后重新运行MR作业？

让我们看看是否有帮助！

在hadoop上的一个流作业中使用多个映射器输入？

[英]Using multiple mapper inputs in one streaming job on hadoop?

Hadoop Streaming简单作业失败错误python

[英]Hadoop Streaming simple job fails error python

python中的Hadoop Streaming Job失败错误

[英]Hadoop Streaming Job failed error in python

Hadoop错误：启动作业时出错，输入路径错误：文件不存在。流命令失败

[英]Hadoop Error: Error launching job , bad input path : File does not exist.Streaming Command Failed

Distcp与Hadoop流作业

[英]Distcp with Hadoop streaming job

Mapper 代码与 unix 管道一起运行，但不与 hadoop 流一起运行。错误不适用。流命令失败

[英]Mapper code runs with unix pipe but not with hadoop streaming. Error NA. Streaming Command Failed

如何使用python在hadoop流媒体作业中使用文件？

[英]How to use a file in a hadoop streaming job using python?

使用Python Mapper进行Hadoop流式传输的多个输出文件

[英]Multiple Output Files for Hadoop Streaming with Python Mapper

Hadoop Streaming：Mapper'包装'二进制可执行文件

[英]Hadoop Streaming: Mapper 'wrapping' a binary executable

Hadoop Streaming - 无法找到文件错误

[英]Hadoop Streaming - Unable to find file error

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在hadoop上的一个流作业中使用多个映射器输入？ Hadoop Streaming简单作业失败错误python python中的Hadoop Streaming Job失败错误 Hadoop错误：启动作业时出错，输入路径错误：文件不存在。流命令失败 Distcp与Hadoop流作业 Mapper 代码与 unix 管道一起运行，但不与 hadoop 流一起运行。错误不适用。流命令失败如何使用python在hadoop流媒体作业中使用文件？使用Python Mapper进行Hadoop流式传输的多个输出文件 Hadoop Streaming：Mapper'包装'二进制可执行文件 Hadoop Streaming - 无法找到文件错误

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM