简体   繁体   English

在 aws 胶水作业中建立联系是否必不可少?

[英]Is it essential to have a connection in a aws glue job?

I have my data tables in the Glue Metadata catalog.我在 Glue 元数据目录中有我的数据表。 I need to use this data in my glue job's python shell script.我需要在我的胶水作业的 python shell 脚本中使用这些数据。 When I create the glue job it gives me the option to select the connection type at last.当我创建胶水作业时,它最后让我可以选择 select 连接类型。 Is it essential to add a connection?是否必须添加连接? If the tables are in glue catalog what would be the connection type?如果表在胶水目录中,连接类型是什么?

If the tables are in the Glue Catalog you don't need any connections.如果表在 Glue Catalog 中,则不需要任何连接。 As long as your data sources / data sinks are Glue / S3 you don't need a connection apart from a VPC S3 Endpoint.只要您的数据源/数据接收器是 Glue/S3,您就不需要除了 VPC S3 端点之外的连接。

If you want to connect to let's say Redshift or a MySQL database you would need a connection.如果您想连接到 Redshift 或 MySQL 数据库,您需要一个连接。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM