[英]How can I get data from different S3 buckets by AWS Athena?
我有两个 AWS S3 存储桶。 一个存储桶存储产品用户日志。 另一个存储桶存储用户属性(例如性别、年龄等)数据。
我想从这些存储桶中获取用户日志和归因数据,并将数据合并到一个表中。 我可以知道该怎么做吗?
很容易...
CREATE TABLE
定义每个表,指定数据的LOCATION
您可以同时从两个表中查询数据,也可以使用CREATE TABLE AS
创建一个新表,该表是此类查询的 output。
只需使用以下方法创建两个表
CREATE [EXTERNAL] TABLE [IF NOT EXISTS]
[db_name.]table_name [(col_name data_type [COMMENT col_comment] [, ...] )]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
[ROW FORMAT row_format]
[STORED AS file_format]
[WITH SERDEPROPERTIES (...)] ]
[LOCATION 's3://bucket_name/[folder]/']
[TBLPROPERTIES ( ['has_encrypted_data'='true | false',] ['classification'='aws_glue_classification',] property_name=property_value [, ...] ) ]
然后加入两个表以创建所需的结果表
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.