繁体   English   中英

使用 AWS Athena 加载和卸载 JSON 文件

[英]Loading and unloading JSON files using AWS Athena

我正在尝试使用 AWS Athena 加载、过滤和卸载一些 json 文件:

CREATE EXTERNAL TABLE IF NOT EXISTS
json_based_table(file_line string)
LOCATION 's3://<my_bucket>/<some_path/';

UNLOAD
(SELECT file_line from json_based_table limit 10)
TO 's3://<results_bucket>/samples/'
WITH (format = 'JSON');

问题是 output 是一组包含 json 的文件,每行有一个键“file_line”,其值是原始文件中的 json 行作为字符串。

如何仅卸载此类表值? (忽略我必须创建以加载文件的列名)

似乎通过选择

WITH (format = 'TEXTFILE');

我可以得到我想要的。 选择 JSON 作为格式有利于在文件中保留表格的表格结构,并且在这种情况下是一个误导性名称。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM