繁体   English   中英

Spark Streaming Checkpointing抛出S3异常

[英]Spark Streaming Checkpointing throws S3 exception

我在区域eu-central-1中使用S3存储桶作为我的火花流工作的检查点目录。

它将数据写入该目录,但每10个批处理失败,并出现以下异常:

org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 4040.0 failed 4 times, most recent failure: Lost task 0.3 in stage 4040.0 (TID 0, 127.0.0.1, executor 0): com.amazonaws.services.s3.model.AmazonS3Exception: Status Code: 400, AWS Service: Amazon S3, AWS Request ID: ..., AWS Error Code: null, AWS Error Message: Bad Request

发生这种情况时,批处理数据将丢失。 我该如何解决这个问题?

它最终成为eu-central-1中存储桶的身份验证例外,因为该S3区域使用V4身份验证。

它是在驱动程序本身上配置的,但不是在工作者上配置的,这就是为什么有些工作而有些工作没有。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM