繁体 English 中英

没有输入文件的Hadoop流作业

[英]Hadoop Streaming Job with no input file

原文 2014-04-02 19:20:00 3 1 hadoop/ hadoop-streaming

是否可以执行没有输入文件的Hadoop Streaming作业？

在我的用例中，我能够使用单个映射器和执行参数为化简器生成必要的记录。 目前，我正在使用单行存根输入文件，我想删除此要求。

我们有2个用例。
1）

我想从对所有节点可用的网络位置将文件的负载分布到hdfs中。 基本上，我将在映射器中运行ls并将输出发送到一小组reducer。
我们将针对几个模型利用几个不同的参数范围进行拟合。 模型名称不会更改，而将在映射器中生成要运行的测试列表时，将其作为键转到化简器。

1 个解决方案

根据文档，这是不可能的。 以下是执行所需的参数：

输入目录名或文件名
输出目录名
映射器可执行文件或JavaClassName
reducer可执行文件或JavaClassName

看起来提供虚拟输入文件是当前的方法。

具有二进制输入的Hadoop流作业？

[英]Hadoop Streaming Job with binary input?

Hadoop作业输入文件的位置

[英]Location of a Hadoop job input file

Hadoop错误：启动作业时出错，输入路径错误：文件不存在。流命令失败

[英]Hadoop Error: Error launching job , bad input path : File does not exist.Streaming Command Failed

Hadoop流作业失败

[英]Hadoop Streaming job failing

Distcp与Hadoop流作业

[英]Distcp with Hadoop streaming job

Python MapReduce Hadoop Streaming Job需要多个输入文件？

[英]Python MapReduce Hadoop Streaming Job that requires multiple input files?

无法运行hadoop流作业：缺少必需的选项：输入，输出

[英]Can not run hadoop streaming job: Missing required options: input, output

在流式hadoop程序中获取输入文件名

[英]Get input file name in streaming hadoop program

Hadoop MapReduce作业输入文件ClassNotFound

[英]Hadoop MapReduce Job Input File ClassNotFound

Hadoop流作业执行中映射器的“文本文件繁忙”错误

[英]“Text file busy” error for the mapper in a Hadoop streaming job execution

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 具有二进制输入的Hadoop流作业？ Hadoop作业输入文件的位置 Hadoop错误：启动作业时出错，输入路径错误：文件不存在。流命令失败 Hadoop流作业失败 Distcp与Hadoop流作业 Python MapReduce Hadoop Streaming Job需要多个输入文件？无法运行hadoop流作业：缺少必需的选项：输入，输出在流式hadoop程序中获取输入文件名 Hadoop MapReduce作业输入文件ClassNotFound Hadoop流作业执行中映射器的“文本文件繁忙”错误

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM