简体   繁体   English

如何查看 AWS Glue Spark UI

[英]How to view AWS Glue Spark UI

In my Glue job, I have enabled Spark UI and specified all the necessary details (s3 related etc.) needed for Spark UI to work.在我的 Glue 作业中,我启用了 Spark UI 并指定了 Spark UI 工作所需的所有必要细节(s3 相关等)。
How can I view the DAG/Spark UI of my Glue job?如何查看我的 Glue 作业的 DAG/Spark UI?

You need to setup an ec2 instance that can host the history server.您需要设置一个可以托管历史服务器的 ec2 实例。

The below documentation has links to CloudFormation templates that you can use.以下文档包含指向您可以使用的 CloudFormation 模板的链接。 https://docs.aws.amazon.com/glue/latest/dg/monitor-spark-ui-history.html https://docs.aws.amazon.com/glue/latest/dg/monitor-spark-ui-history.html

You can access the history server via the ec2 instance(default on 18080).您可以通过 ec2 实例访问历史服务器(默认为 18080)。 You need to configure the networks and ports suitably.您需要适当地配置网络和端口。

EDIT - There is also an option to setup SparkUI locally.编辑 - 还有一个选项可以在本地设置 SparkUI。 This requires downloading the docker image from aws-glue-samples repo amd settin the AWS credential and s3 location there.这需要从 aws-glue-samples 存储库下载 docker 映像并在那里设置 AWS 凭证和 s3 位置。 This server consummes the files that the glue job generates.此服务器使用胶水作业生成的文件。 The files are about 4MB large.这些文件大约 4MB 大。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM