繁体 English 中英

使用同一S3存储桶的多个凭据进行Spark

[英]Spark using multiple credentials for the same S3 bucket

原文 2019-08-07 18:27:05 4 1 amazon-web-services/ apache-spark/ hadoop/ amazon-s3/ apache-spark-sql

我将Spark 2.1.1与Hadoop 2.7.3结合使用，并且在一个管道中使用来自不同S3位置的数据。

我正在使用spark.sparkContext.hadoopConfiguration.set(“fs.s3a.access.key”, $KEY)设置s3a凭据spark.sparkContext.hadoopConfiguration.set(“fs.s3a.access.key”, $KEY)并进行秘密操作。

当我使用不同的S3存储桶时，它工作良好，但是当我对同一存储桶具有不同的凭据（一个S3存储桶中的文件夹级别权限）时，仅处理第一对凭据。

当我尝试使用第二对文件访问文件时，似乎火花配置未更新，并且由于调用S3时出现403错误而失败。

我要实现的是在同一批处理中使用不同的凭据处理来自同一S3存储桶的文件。

1 个解决方案

对此没有真正的支持。 每个S3A连接器实例仅具有一组凭据，特定桶的第一个S3A文件系统实例通过其URI缓存在文件系统缓存中。 下次寻找该文件系统URI的实例时，将拾取具有其凭证的现有实例。

同一个 S3 存储桶中的多个网站

[英]Multiple websites in the same S3 bucket

无法使用spark读取s3存储桶

[英]Unable to read from s3 bucket using spark

使用Scala Spark从s3存储桶读取zip文件

[英]reading zip file from s3 bucket using scala spark

s3存储桶删除缺少的凭据错误

[英]s3 bucket delete missing credentials error

多个 s3 存储桶对象创建事件触发相同的 lambda

[英]Multiple s3 bucket object creation event trigger same lambda

从 s3 存储桶中获取具有相同前缀的多个对象

[英]Fetching multiple objects with same prefix from s3 bucket

读取s3桶时出错了火花

[英]Error reading s3 bucket it spark

无法将火花 dataframe 写入 s3 存储桶

[英]Not able to write the spark dataframe to s3 bucket

Spark：将数据帧写入s3存储桶

[英]Spark : Writing data frame to s3 bucket

在同一s3存储桶中使用boto3重命名密钥

[英]Rename key using boto3 within the same s3 bucket

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 同一个 S3 存储桶中的多个网站无法使用spark读取s3存储桶使用Scala Spark从s3存储桶读取zip文件 s3存储桶删除缺少的凭据错误多个 s3 存储桶对象创建事件触发相同的 lambda 从 s3 存储桶中获取具有相同前缀的多个对象读取s3桶时出错了火花无法将火花 dataframe 写入 s3 存储桶 Spark：将数据帧写入s3存储桶在同一s3存储桶中使用boto3重命名密钥

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM