[英]Unable to run AWS Glue Crawler due to IAM Permissions
我无法运行新创建的 AWS Glue Crawler。 我在https://docs.aws.amazon.com/glue/latest/dg/create-an-iam-role.html?icmpid=docs_glue_console遵循了 IAM 角色指南
AWSGlueServiceRole
和AmazonS3FullAccess
托管策略创建了新的爬虫角色AWSGlueServiceRoleDefault
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Principal": {
"Service": "glue.amazonaws.com"
},
"Action": "sts:AssumeRole"
}
]
}
执行 Crawler 后,它会在 8 秒内失败并出现以下错误:
爬虫无法启动。 验证附加到爬虫中定义的 IAM 角色的策略中的权限
还需要哪些其他 IAM 权限?
如果您通过 JDBC 连接到外部数据存储来爬网表和模式,请确保您已为 Glue 连接指定了网络选项。 如果未指定选项,我会得到完全相同的错误。 我认为这里的错误信息有些误导。
这是我为爬虫定义的内容:
一个角色,例如 AWSGlueServiceRoleDefault 附加了 AWSGlueServiceRole 托管策略。
创建一个 NAT 网关并将其附加到您在步骤 2 中定义的 su.net,以便您的爬虫程序可以使用公共 IP 连接到外部数据存储。
如果您尝试连接 RDS,由于爬虫和数据库都在 AWS.network 中,因此不需要 NAT。 只需定义安全组规则以允许连接。 在此处查看文档。
如果 S3 是目标数据源,则建议使用 S3 的 VPC 端点。 在此处查看文档。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.