简体繁体 English

如何在 pyspark 中的 AWS Glue 作业中避免 OOM 错误

[英]how can i avoid OOMs error in AWS Glue Job in pyspark

原文 2021-08-27 09:03:37 1 1 python/ apache-spark/ pyspark/ aws-glue

I am getting this error while running AWS Glue job using 40 workers and processing 40GB data我在使用 40 个工作人员运行 AWS Glue 作业并处理 40GB 数据时遇到此错误

Caused by: org.apache.spark.memory.SparkOutOfMemoryError: error while calling spill() on org.apache.spark.util.collection.unsafe.sort.UnsafeExternalSorter@5fa14240 : No space left on device

How can i optimize my job to avoid such error on pyspark我如何优化我的工作以避免在 pyspark 上出现此类错误

Here is the pic of metrics glue_metrics这是指标glue_metrics的图片

1 个解决方案

AWS Glue Spark shuffle manager with Amazon S3使用 Amazon S3 的 AWS Glue Spark 随机播放管理器

Requires using Glue 2.0需要使用 Glue 2.0

See the following links.请参阅以下链接。

如何更改 pyspark aws-glue 中的架构？ - How I Can change schema in pyspark aws-glue?

AWS Glue Pyspark，结束有条件的工作？ - AWS Glue Pyspark, End a job with a condition?

如何在 python shell AWS Glue 作业中导入外部 python 库 - How can I import external python libraries in python shell AWS Glue job

如何更新 AWS Glue 数据库 - How can I Update AWS Glue Database

在AWS Glus pyspark作业中从s3加载JSON - Load JSON from s3 inside aws glue pyspark job

一步一步设置aws ETL胶水pyspark作业指南 - Guide to setup aws ETL glue pyspark job by step by step

AWS Glue作业流程 - AWS Glue Job Flow

可重复使用的 AWS Glue 作业 - Reusable AWS Glue Job

如何使用 AWS GlueOperator 触发 Glue 作业 - How to trigger Glue Job using AWS GlueOperator

如何为 AWS 胶水工作使用额外的文件 - How to use extra files for AWS glue job

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何更改 pyspark aws-glue 中的架构？ - How I Can change schema in pyspark aws-glue? AWS Glue Pyspark，结束有条件的工作？ - AWS Glue Pyspark, End a job with a condition? 如何在 python shell AWS Glue 作业中导入外部 python 库 - How can I import external python libraries in python shell AWS Glue job 如何更新 AWS Glue 数据库 - How can I Update AWS Glue Database 在AWS Glus pyspark作业中从s3加载JSON - Load JSON from s3 inside aws glue pyspark job 一步一步设置aws ETL胶水pyspark作业指南 - Guide to setup aws ETL glue pyspark job by step by step AWS Glue作业流程 - AWS Glue Job Flow 可重复使用的 AWS Glue 作业 - Reusable AWS Glue Job 如何使用 AWS GlueOperator 触发 Glue 作业 - How to trigger Glue Job using AWS GlueOperator 如何为 AWS 胶水工作使用额外的文件 - How to use extra files for AWS glue job

相关标签

如何在 pyspark 中的 AWS Glue 作业中避免 OOM 错误

问题描述

1 个解决方案

解决方案1
1 2022-05-13 07:42:44

如何在 pyspark 中的 AWS Glue 作业中避免 OOM 错误

问题描述

1 个解决方案

解决方案1 1 2022-05-13 07:42:44

解决方案1
1 2022-05-13 07:42:44