簡體   English   中英

不能看到mapreduce wordcount輸出文件

[英]Cant see mapreduce wordcount output file

我按照michael noll的教程下載並安裝了hadoop。 我還運行了單詞計數示例。 但是我看不到相同的輸出。 當我在dfs中看到文件時,我得到了我擁有的所有文件列表

在此處輸入圖片說明

但是當我處理這些文件時,出現錯誤:

在此處輸入圖片說明

想知道那里出了什么問題...

HDFS中要嘗試保存的文件是一個目錄(標志列顯示drwxr-xr-x )。 Hadoop作業通常會將結果輸出到目錄中,每個化簡器(如果運行沒有化簡器的作業,則每個映射器一個文件)。

因此,如果是該文件夾的內容,您應該看到一些part-r文件-試着整理一下這些文件:

bin/hadoop dfs -cat /user/ravi/tempoutput.txt/part-r-*

運行wordcount示例的預期語法為: bin/hadoop jar hadoop-examples-1.0.4.jar wordcount <input_dir> <output_dir> 您的字數可能沒有處理任何數據,因此看不到任何結果。 嘗試運行bin/hadoop jar hadoop-examples-1.0.4.jar wordcount /user/ravi/inputall /user/ravi/output然后運行bin/hadoop dfs -ls /user/ravi/output來查看結果。

此外,在運行地圖后(直接在控制台中或使用Web界面),應檢查該地圖的詳細信息以減少yob的執行。 應該有關於已處理的輸入記錄/字節數的詳細信息。 您也可以在Web瀏覽器中瀏覽整個文件系統: http://localhost:50070/dfshealth.jsp

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM