繁体   English   中英

AWS Athena 如何从不同的 S3 存储桶获取数据?

[英]How can I get data from different S3 buckets by AWS Athena?

我有两个 AWS S3 存储桶。 一个存储桶存储产品用户日志。 另一个存储桶存储用户属性(例如性别、年龄等)数据。

我想从这些存储桶中获取用户日志和归因数据,并将数据合并到一个表中。 我可以知道该怎么做吗?

很容易...

  • 使用CREATE TABLE定义每个表,指定数据的LOCATION
  • 使用标准 SQL 运行连接两个表的查询

您可以同时从两个表中查询数据,也可以使用CREATE TABLE AS创建一个新表,该表是此类查询的 output。

只需使用以下方法创建两个表

CREATE [EXTERNAL] TABLE [IF NOT EXISTS]
 [db_name.]table_name [(col_name data_type [COMMENT col_comment] [, ...] )]
 [COMMENT table_comment]
 [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
 [ROW FORMAT row_format]
 [STORED AS file_format] 
 [WITH SERDEPROPERTIES (...)] ]
 [LOCATION 's3://bucket_name/[folder]/']
 [TBLPROPERTIES ( ['has_encrypted_data'='true | false',] ['classification'='aws_glue_classification',] property_name=property_value [, ...] ) ]

然后加入两个表以创建所需的结果表

AWS 文档链接

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM