[英]Loading and unloading JSON files using AWS Athena
我正在尝试使用 AWS Athena 加载、过滤和卸载一些 json 文件:
CREATE EXTERNAL TABLE IF NOT EXISTS
json_based_table(file_line string)
LOCATION 's3://<my_bucket>/<some_path/';
UNLOAD
(SELECT file_line from json_based_table limit 10)
TO 's3://<results_bucket>/samples/'
WITH (format = 'JSON');
问题是 output 是一组包含 json 的文件,每行有一个键“file_line”,其值是原始文件中的 json 行作为字符串。
如何仅卸载此类表值? (忽略我必须创建以加载文件的列名)
似乎通过选择
WITH (format = 'TEXTFILE');
我可以得到我想要的。 选择 JSON 作为格式有利于在文件中保留表格的表格结构,并且在这种情况下是一个误导性名称。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.