繁体 English 中英

无法填充 AWS Glue ETL 作业指标

[英]Not able to populate AWS Glue ETL Job metrics

原文 2020-04-27 08:07:40 7 3 amazon-web-services/ amazon-s3/ amazon-redshift/ metrics/ aws-glue

我正在尝试为某些测试填充最大可能的 Glue 作业指标，以下是我创建的设置：

爬虫从放置在 S3 存储桶中的 CSV 文件中读取数据（500 行的虚拟客户数据）。
使用另一个爬虫来爬取在 Redshift 集群中创建的表。
ETL 作业最终从 s3 中的 csv 文件中读取数据并将其转储到 Redshift 表中。

作业运行没有任何问题，我可以看到最终数据被转储到 Redshift 表中，但是，最后，只有低于 5 个 Cloudwatch 指标被填充：

胶水.jvm.heap.usage
胶水.jvm.heap.used
胶水.s3.filesystem.read_bytes
胶水.s3.filesystem.write_bytes
胶水.system.cpuSystemLoad

还有大约 20 个指标没有被填充。

关于如何填充这些剩余指标的任何建议？

3 个解决方案

遇到了同样的问题。 你的glue.s3.filesystem.read_bytes 和glue.s3.filesystem.write_bytes 有数据吗？

一个可能的原因是，如果作业在 30 秒内完成，则不会发出 AWS Glue 作业指标

在运行作业时启用监控选项卡下的指标选项。

假设您使用 Glue 2.0 版进行上述作业，请注意 AWS Glue 2.0 版不使用动态分配，因此 ExecutorAllocationManager 指标不可用。 使用 Glue 1.0 的引用，您应该确认所有记录的指标现在都可用。

https://docs.aws.amazon.com/glue/latest/dg/reduced-start-times-spark-etl-jobs.html#reduced-start-times-limitations

使用日期作为变量为 ETL 参数化 AWS Glue 作业

[英]Parameterize AWS Glue Job for ETL with Date as variables

ETL：在AWS胶粘作业中展平嵌套数组

[英]ETL : Flatten a nested array in an AWS glue job

了解 AWS Glue 详细的作业指标

[英]Understanding AWS Glue detailed job metrics

从 AWS Redshift 到 S3 的 AWS Glue ETL 作业失败

[英]AWS Glue ETL job from AWS Redshift to S3 fails

AWS Glue ETL 作业和 AWS EMR 有什么区别？

[英]What is the difference between AWS Glue ETL Job and AWS EMR?

AWS Glue：ETL 作业会创建许多空输出文件

[英]AWS Glue: ETL job creates many empty output files

使用 AWS Glue 爬网程序/分类器/ETL 作业将带有数组的 JSON 展平

[英]Flatten JSON with array using AWS Glue crawler / classifier / ETL job

AWS Glue 工作流在任何 ETL 作业失败时触发 email

[英]AWS Glue Workflow to trigger email on any ETL job failure

AWS胶水ETL作业在批次的S3事件上触发

[英]AWS Glue ETL Job triggered on batches of S3 Events

AWS Glue ETL作业如何检索数据？

[英]How does AWS Glue ETL job retrieve data?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用日期作为变量为 ETL 参数化 AWS Glue 作业 ETL：在AWS胶粘作业中展平嵌套数组了解 AWS Glue 详细的作业指标从 AWS Redshift 到 S3 的 AWS Glue ETL 作业失败 AWS Glue ETL 作业和 AWS EMR 有什么区别？ AWS Glue：ETL 作业会创建许多空输出文件使用 AWS Glue 爬网程序/分类器/ETL 作业将带有数组的 JSON 展平 AWS Glue 工作流在任何 ETL 作业失败时触发 email AWS胶水ETL作业在批次的S3事件上触发 AWS Glue ETL作业如何检索数据？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM