簡體 English 中英

為每個映射器hadoop在內存中加載相同的文件

[英]Loading the same file in memory for each mapper hadoop

原文 2012-11-02 03:19:39 5 1 java/ hadoop/ mapreduce

我遇到了一種算法，其中，每個映射器都將相同的文件加載到主存儲器中。

我認為，對於每個映射器，我們必須使用分布式緩存來獲取文件，讀取文件並將其加載到內存中。 實施此操作后，我發現地圖需要很長時間才能完成。 我假設這是因為，每次從本地磁盤讀取每個映射器值時都會讀取文件。

我執行正確嗎？

還有其他建議嗎？

請幫助！ 提前致謝！

1 個解決方案

您要在Mapper setup（）方法中從本地磁盤讀取。 使用實例變量來保留引用。

為每個映射器加載相同的文件

[英]Loading same file for each mapper

Hadoop為每個映射器使用一個實例

[英]Hadoop use one instance for each mapper

無法從Mapper Hadoop打開HDFS文件

[英]Not able to open HDFS file from mapper Hadoop

將文件位置作為值傳遞給hadoop映射器？

[英]Pass file location as value to hadoop mapper?

如何將內容從映射器寫入文件-Hadoop

[英]How to write the contents from mapper into file - Hadoop

如何在Hadoop Mapper中處理XML文件

[英]How to process XML file in Hadoop Mapper

Hadoop從mapper寫入新文件

[英]Hadoop writing to a new file from mapper

如何使每個hadoop映射器獲取文件對，即整個輸入文件（.csv）和整個元數據文件（.json）

[英]How to make each hadoop mapper to get a file pair i.e. a whole input file (.csv) and a whole meta data file (.json)

如何告訴hadoop為單個映射器作業分配多少內存？

[英]How to tell hadoop how much memory to allocate to a single mapper job?

在hadoop 2.7.3中將映射器更改為每個工作程序上的核心數

[英]change mapper to number of cores on each worker in hadoop 2.7.3

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 為每個映射器加載相同的文件 Hadoop為每個映射器使用一個實例無法從Mapper Hadoop打開HDFS文件將文件位置作為值傳遞給hadoop映射器？如何將內容從映射器寫入文件-Hadoop 如何在Hadoop Mapper中處理XML文件 Hadoop從mapper寫入新文件如何使每個hadoop映射器獲取文件對，即整個輸入文件（.csv）和整個元數據文件（.json）如何告訴hadoop為單個映射器作業分配多少內存？在hadoop 2.7.3中將映射器更改為每個工作程序上的核心數

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM