簡體   English   中英

AWS Athena 如何從不同的 S3 存儲桶獲取數據?

[英]How can I get data from different S3 buckets by AWS Athena?

我有兩個 AWS S3 存儲桶。 一個存儲桶存儲產品用戶日志。 另一個存儲桶存儲用戶屬性(例如性別、年齡等)數據。

我想從這些存儲桶中獲取用戶日志和歸因數據,並將數據合並到一個表中。 我可以知道該怎么做嗎?

很容易...

  • 使用CREATE TABLE定義每個表,指定數據的LOCATION
  • 使用標准 SQL 運行連接兩個表的查詢

您可以同時從兩個表中查詢數據,也可以使用CREATE TABLE AS創建一個新表,該表是此類查詢的 output。

只需使用以下方法創建兩個表

CREATE [EXTERNAL] TABLE [IF NOT EXISTS]
 [db_name.]table_name [(col_name data_type [COMMENT col_comment] [, ...] )]
 [COMMENT table_comment]
 [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
 [ROW FORMAT row_format]
 [STORED AS file_format] 
 [WITH SERDEPROPERTIES (...)] ]
 [LOCATION 's3://bucket_name/[folder]/']
 [TBLPROPERTIES ( ['has_encrypted_data'='true | false',] ['classification'='aws_glue_classification',] property_name=property_value [, ...] ) ]

然后加入兩個表以創建所需的結果表

AWS 文檔鏈接

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM