[英]Unable to run AWS Glue Crawler due to IAM Permissions
我無法運行新創建的 AWS Glue Crawler。 我在https://docs.aws.amazon.com/glue/latest/dg/create-an-iam-role.html?icmpid=docs_glue_console遵循了 IAM 角色指南
AWSGlueServiceRole
和AmazonS3FullAccess
托管策略創建了新的爬蟲角色AWSGlueServiceRoleDefault
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Principal": {
"Service": "glue.amazonaws.com"
},
"Action": "sts:AssumeRole"
}
]
}
執行 Crawler 后,它會在 8 秒內失敗並出現以下錯誤:
爬蟲無法啟動。 驗證附加到爬蟲中定義的 IAM 角色的策略中的權限
還需要哪些其他 IAM 權限?
如果您通過 JDBC 連接到外部數據存儲來爬網表和模式,請確保您已為 Glue 連接指定了網絡選項。 如果未指定選項,我會得到完全相同的錯誤。 我認為這里的錯誤信息有些誤導。
這是我為爬蟲定義的內容:
一個角色,例如 AWSGlueServiceRoleDefault 附加了 AWSGlueServiceRole 托管策略。
創建一個 NAT 網關並將其附加到您在步驟 2 中定義的 su.net,以便您的爬蟲程序可以使用公共 IP 連接到外部數據存儲。
如果您嘗試連接 RDS,由於爬蟲和數據庫都在 AWS.network 中,因此不需要 NAT。 只需定義安全組規則以允許連接。 在此處查看文檔。
如果 S3 是目標數據源,則建議使用 S3 的 VPC 端點。 在此處查看文檔。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.