繁体 English 中英

Hadoop服务器连接，用于将文件从HDFS复制到AWS S3

[英]Hadoop server connection for copying files from HDFS to AWS S3

原文 2018-06-15 21:55:18 2 1 java/ amazon-web-services/ hadoop/ amazon-s3

要求是使用每日CRON安排的独立Java应用程序将hdfs文件从Hadoop集群（非aws）复制到AWS S3存储桶。 将使用AmazonS3.copyObject（）方法进行复制。 如何为源Hadoop集群指定使用Kerberos的服务器连接详细信息，以便S3client可以访问源hdfs文件夹中的文件。

下面的命令较早使用，但不是安全的文件传输方式。

hadoop distcp -Dfs.s3a.access.key = << >> -Dfs.s3a.secret.key = << >> hdfs：// nameservice1 / test / test1 / folder s3a：// <> / test / test1 /夹

1 个解决方案

S3不会靠近kerberos； 您的cronjob将必须使用密钥表上的kinit来对HDFS访问进行身份验证。

将秘密传递给distcp的最安全方法是将其保存在群集FS的JCEKS文件中，例如运行该作业的用户的主目录中的一个文件，该权限仅允许该人读取（最大妄想症：设置一个加密密码，并将其与作业一起传递）。 请参阅使用凭证提供者保护S3凭证

可以尝试的另一种技巧：使用CLI 假定角色命令创建会话凭据，然后将临时凭据传递给distcp ，以使s3a接起来。 这样，是的，秘密对于.ps是可见的，但不是寿命更长的秘密。 与用户的完整帐户相比，您还可以要求访问权限受限的特定角色（例如：仅对一个存储桶进行读/写访问）

AWS EC2用户数据未从Java从S3复制文件

[英]AWS EC2 userdata not copying files from S3 from Java

从Java代码将文件复制到Hadoop HDFS时，“主机中的软件中止了已建立的连接”

[英]“An established connection was aborted by the software in your host machine” while copying file to Hadoop HDFS from Java code

AWS S3存储桶在存储桶之间复制文件

[英]aws s3 bucket copying files between buckets

将数据从mongoDB复制到hdfs时的hadoop jar错误

[英]hadoop jar error while copying data from mongoDB to hdfs

使用distcp或s3distcp将文件从S3复制到HDFS

[英]Copy files from S3 to HDFS using distcp or s3distcp

Java从HDFS传输到S3

[英]Java transfer from HDFS to S3

hadoop hdfs java-将文件列表从hdfs复制到hdfs的最佳方法是什么

[英]hadoop hdfs java - what is the best way to copy a list of files from hdfs to hdfs

Spring Batch - 从 Aws S3 读取文件

[英]Spring Batch - Read files from Aws S3

将文件从 box 文件夹复制到 AWS s3 存储桶

[英]Copy files from box folder to AWS s3 bucket

将文件存储到S3：本地文件与HDFS

[英]Storing files to S3 : local file vs HDFS

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 AWS EC2用户数据未从Java从S3复制文件从Java代码将文件复制到Hadoop HDFS时，“主机中的软件中止了已建立的连接” AWS S3存储桶在存储桶之间复制文件将数据从mongoDB复制到hdfs时的hadoop jar错误使用distcp或s3distcp将文件从S3复制到HDFS Java从HDFS传输到S3 hadoop hdfs java-将文件列表从hdfs复制到hdfs的最佳方法是什么 Spring Batch - 从 Aws S3 读取文件将文件从 box 文件夹复制到 AWS s3 存储桶将文件存储到S3：本地文件与HDFS

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM