繁体 English 中英

从群集的所有计算机访问HDFS文件

[英]Access to HDFS files from all computers of a cluster

原文 2013-02-13 15:06:30 2 1 java/ linux/ hadoop/ mapreduce/ hdfs

我的程序最初是在本地模式下启动的，而现在我的目的是在完全分布式模式下启动的。 为此，有必要从集群的所有计算机访问在reducer和mapper功能中执行读取的文件，因此我在http://answers.mapr.com/questions/4444/上提出了问题。 Hadoop脚本中的选项文件语法（也因为在哪个计算机上执行映射器功能尚不知道（从程序逻辑映射器将只有一个，并且仅使用以下命令启动程序）一个映射器），则还必须在所有群集上提供对通过映射器功能输入到达的文件的访问。在这方面，我有一个问题：是否可以直接使用hdfs-files：即从HDFS的文件系统中的Linux文件系统中预先复制文件（因此，我假设这些文件在Windows的所有计算机上都可用）。群集（如果不是这样，请更正），然后在群集计算机上执行的reducer和mapper函数中使用HDFS Java API读取这些文件？

如果对该问题的回答是肯定的，请举一个从HDFS文件系统中的Linux文件系统复制实例，并通过HDFS Java API将Java中的这些文件读取到程序中，并将其内容记录在java字符串中。

1 个解决方案

将所有输入文件复制到主节点（可以使用scp来完成）。 然后登录到您的主节点（ ssh ）并执行以下操作，将文件从本地文件系统复制到hdfs：

hadoop fs -put $localfilelocation $destination

现在，在您的hadoop作业中，您可以使用输入为hdfs:///$destination 。 无需使用任何额外的API即可读取HDFS。

如果你真的想从HDFS读取文件，并使用比输入其他文件作为addiotional信息，届时提及本。

来自HDFS集群的ListFiles

[英]ListFiles from HDFS Cluster

如何使用Java API访问远程HDFS集群的配置xml文件？

[英]How to access configuration xml files of remote HDFS cluster using Java API?

hdfs文件在伪分布式单节点群集中的位置？

[英]Location of hdfs files in pseudodistributed single node cluster?

在spark java api中以递归方式读取HDFS中的所有文件

[英]reading all files from HDFS recursively in spark java api

从Web应用程序浏览Hdfs集群

[英]Browsing Hdfs cluster from web application

无法在所有计算机上访问JAR中的资源

[英]Can't access resource in a JAR on all computers

包括HDFS路径中文件夹中的所有文件

[英]Including all files in folder in the HDFS path

获取从hdfs到servlet的文件/目录列表

[英]Get list of files/directories from hdfs to servlet

hadoop hdfs java-将文件列表从hdfs复制到hdfs的最佳方法是什么

[英]hadoop hdfs java - what is the best way to copy a list of files from hdfs to hdfs

从Hive连接到HDFS（JSON文件）

[英]Connect from Hive to HDFS (JSON Files)

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 来自HDFS集群的ListFiles 如何使用Java API访问远程HDFS集群的配置xml文件？ hdfs文件在伪分布式单节点群集中的位置？在spark java api中以递归方式读取HDFS中的所有文件从Web应用程序浏览Hdfs集群无法在所有计算机上访问JAR中的资源包括HDFS路径中文件夹中的所有文件获取从hdfs到servlet的文件/目录列表 hadoop hdfs java-将文件列表从hdfs复制到hdfs的最佳方法是什么从Hive连接到HDFS（JSON文件）

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM