繁体 English 中英

为每个映射器hadoop在内存中加载相同的文件

[英]Loading the same file in memory for each mapper hadoop

原文 2012-11-02 03:19:39 6 1 java/ hadoop/ mapreduce

我遇到了一种算法，其中，每个映射器都将相同的文件加载到主存储器中。

我认为，对于每个映射器，我们必须使用分布式缓存来获取文件，读取文件并将其加载到内存中。 实施此操作后，我发现地图需要很长时间才能完成。 我假设这是因为，每次从本地磁盘读取每个映射器值时都会读取文件。

我执行正确吗？

还有其他建议吗？

请帮助！ 提前致谢！

1 个解决方案

您要在Mapper setup（）方法中从本地磁盘读取。 使用实例变量来保留引用。

为每个映射器加载相同的文件

[英]Loading same file for each mapper

Hadoop为每个映射器使用一个实例

[英]Hadoop use one instance for each mapper

无法从Mapper Hadoop打开HDFS文件

[英]Not able to open HDFS file from mapper Hadoop

将文件位置作为值传递给hadoop映射器？

[英]Pass file location as value to hadoop mapper?

如何将内容从映射器写入文件-Hadoop

[英]How to write the contents from mapper into file - Hadoop

如何在Hadoop Mapper中处理XML文件

[英]How to process XML file in Hadoop Mapper

Hadoop从mapper写入新文件

[英]Hadoop writing to a new file from mapper

如何使每个hadoop映射器获取文件对，即整个输入文件（.csv）和整个元数据文件（.json）

[英]How to make each hadoop mapper to get a file pair i.e. a whole input file (.csv) and a whole meta data file (.json)

如何告诉hadoop为单个映射器作业分配多少内存？

[英]How to tell hadoop how much memory to allocate to a single mapper job?

在hadoop 2.7.3中将映射器更改为每个工作程序上的核心数

[英]change mapper to number of cores on each worker in hadoop 2.7.3

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 为每个映射器加载相同的文件 Hadoop为每个映射器使用一个实例无法从Mapper Hadoop打开HDFS文件将文件位置作为值传递给hadoop映射器？如何将内容从映射器写入文件-Hadoop 如何在Hadoop Mapper中处理XML文件 Hadoop从mapper写入新文件如何使每个hadoop映射器获取文件对，即整个输入文件（.csv）和整个元数据文件（.json）如何告诉hadoop为单个映射器作业分配多少内存？在hadoop 2.7.3中将映射器更改为每个工作程序上的核心数

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM