繁体   English   中英

通过存储在 S3 中的 AWS Athena 读取相同格式的 JSON 和 CSV

[英]Reading JSON & CSV of same format through AWS Athena Stored in S3

我在存储桶内的 S3 文件夹中有不同的数据格式 -

AWS S3 存储桶内的文件夹

创建的表对于所有 CSV、JSON 和 gz 格式文件具有相同的列。

AWS Athena 中的表

现在我通过查询从 Athena 查询数据 -

SELECT *
FROM test2
WHERE readtime >= '2016-10-12'
  AND readtime <  '2016-10-24'
ORDER BY readtime

我可以从 CSV 和 GZ 文件格式中获取数据,但不能从 JSON 文件中获取数据。 我是否应该使用不同的格式来查询 JSON 文件? 我可以使用同一个表来查询我用于 CSV 文件的 JSON 文件吗?

您需要在 JSON 文件的顶部创建一个不同的表,该表将使用 JsonSerDe。

是的,根据 Tanveer 的回答,您需要为 JSON 创建一个单独的表。 但是通过最近宣布的一项名为 Federated Queries 的功能(即,在撰写本文时,在us-east-1中预览),您应该能够使用相同的查询来查询两个表。 请参阅https://docs.aws.amazon.com/athena/latest/ug/writing-federated-queries.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM