簡體 English 中英

在EMR群集上運行Spark作業時發生異常“ java.io.IOException：所有數據節點均損壞”

[英]Exceptions while running Spark job on EMR cluster “java.io.IOException: All datanodes are bad”

原文 2019-04-30 16:21:34 3 1 scala/ amazon-web-services/ apache-spark/ amazon-emr

我們擁有AWS EMR設置來處理用Scala編寫的作業。 我們能夠在小型數據集上運行作業，但是在大型數據集上運行相同作業時，出現異常“ java.io.IOException：所有數據節點均損壞。”

1 個解決方案

將spark.shuffle.service.enabled設置為true可以為我解決此問題。

AWS EMR的默認配置已將spark.dynamicAllocation.enabled設置為true，但將spark.shuffle.service.enabled設置為false 。

spark.dynamicAllocation.enabled允許Spark將執行程序動態分配給其他任務。 如果將spark.shuffle.service.enabled設置為false ，則將禁用外部隨機播放服務，並且數據僅存儲在執行程序上。 重新分配執行程序后，數據將丟失，並且出現異常“ java.io.IOException：所有數據節點均損壞”。 引發數據請求。

線程“主”java.io.IOException 中的異常：作業失敗

[英]Exception in thread "main" java.io.IOException: Job failed

Spark＆hbase：java.io.IOException：對等重置連接

[英]Spark&hbase: java.io.IOException: Connection reset by peer

運行sbt失敗 - java.io.IOException：設備上沒有剩余空間

[英]Running sbt fails - java.io.IOException: No space left on device

從 ensime 運行 sbt 時出現 java.io.IOException？

[英]java.io.IOException when running sbt from ensime?

sc.textFile() 在運行命令以獲取文件權限時出錯：java.io.IOException: (null) entry in command string

[英]sc.textFile() gives Error while running command to get file permissions : java.io.IOException: (null) entry in command string

java.io.IOException：方案的無文件系統：hdfs

[英]java.io.IOException: No FileSystem for scheme : hdfs

Spark在Gzip中編碼並發送到S3 - java.io.IOException：設備上沒有剩余空間

[英]Spark encode in Gzip and send to S3 - java.io.IOException: No space left on device

讀取文件時 scala 項目出錯：原因：java.io.IOException：方案沒有文件系統：文件

[英]Error in scala project while reading file : Caused by: java.io.IOException: No FileSystem for scheme: file

java.io.IOException：無法在 Hadoop 二進制文件中找到可執行文件 null\bin\winutils.exe。火花 Eclipse 在 windows 7

[英]java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. spark Eclipse on windows 7

SBT發布未將jar文件上傳到工件（發布）java.io.IOException：對URL的PUT操作失敗，狀態碼為400：錯誤的請求

[英]SBT publish is not uploading jar file to artifactory (publish) java.io.IOException: PUT operation to URL failed with status code 400: Bad Request

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 線程“主”java.io.IOException 中的異常：作業失敗 Spark＆hbase：java.io.IOException：對等重置連接運行sbt失敗 - java.io.IOException：設備上沒有剩余空間從 ensime 運行 sbt 時出現 java.io.IOException？ sc.textFile() 在運行命令以獲取文件權限時出錯：java.io.IOException: (null) entry in command string java.io.IOException：方案的無文件系統：hdfs Spark在Gzip中編碼並發送到S3 - java.io.IOException：設備上沒有剩余空間讀取文件時 scala 項目出錯：原因：java.io.IOException：方案沒有文件系統：文件 java.io.IOException：無法在 Hadoop 二進制文件中找到可執行文件 null\bin\winutils.exe。火花 Eclipse 在 windows 7 SBT發布未將jar文件上傳到工件（發布）java.io.IOException：對URL的PUT操作失敗，狀態碼為400：錯誤的請求

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM