[英]How can I get data from different S3 buckets by AWS Athena?
我有兩個 AWS S3 存儲桶。 一個存儲桶存儲產品用戶日志。 另一個存儲桶存儲用戶屬性(例如性別、年齡等)數據。
我想從這些存儲桶中獲取用戶日志和歸因數據,並將數據合並到一個表中。 我可以知道該怎么做嗎?
很容易...
CREATE TABLE
定義每個表,指定數據的LOCATION
您可以同時從兩個表中查詢數據,也可以使用CREATE TABLE AS
創建一個新表,該表是此類查詢的 output。
只需使用以下方法創建兩個表
CREATE [EXTERNAL] TABLE [IF NOT EXISTS]
[db_name.]table_name [(col_name data_type [COMMENT col_comment] [, ...] )]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
[ROW FORMAT row_format]
[STORED AS file_format]
[WITH SERDEPROPERTIES (...)] ]
[LOCATION 's3://bucket_name/[folder]/']
[TBLPROPERTIES ( ['has_encrypted_data'='true | false',] ['classification'='aws_glue_classification',] property_name=property_value [, ...] ) ]
然后加入兩個表以創建所需的結果表
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.