繁体   English   中英

AWS athena 在尝试查询 S3 中已在 Glue 数据目录中编目的文件时出错

[英]AWS athena giving error when trying to query files in S3 that have already been catalogued in Glue data catalog

尝试使用 S3 为 .csv.gz 格式的文件构建数据湖,然后在 AWS 环境本身中进一步清理/处理数据。 首先使用 AWS Glue 创建数据目录\(爬虫能够识别所有表)。 目录中的表在 AWS Athena 中也可用,但是当我尝试从表中运行 Select * 时,出现以下错误。

打开 Hive split s3://BUCKET_NAME/HEADER FOLDER/FILENAME.csv.gz (offset=0, length=44354) 使用 org.apache.hadoop.mapred.TextInputFormat 时出错:S3 路径 F 路径上的权限被拒绝_NAME 3///BUCKDERETRET /文件名.csv.gz

可能是该文件是 CSV.GZ 格式,这就是为什么它不能按原样访问的原因,或者我是否需要为用户或角色提供对这些文件的特定访问权限?

您需要修复您的权限。 该错误表明运行查询的主体(用户/角色)没有在 S3 上读取 object 的权限。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM