[英]AWS | Data pull from SFTP
I'm planning to write a data pipeline that pull the data from on-prem SFTP server to S3.我打算编写一个数据管道,将数据从本地 SFTP 服务器拉到 S3。 How can I achieve this?
我怎样才能做到这一点? I am interested in AWS specific services only.
我只对 AWS 特定服务感兴趣。
AWS provides a native way to transfer your files from any on-prem servers to s3 directly AWS Transfer Family . AWS 提供了一种本地方式,可以将您的文件从任何本地服务器直接传输到 s3 AWS Transfer Family 。 It is a multi-AZ, highly available, massively scaling SFTP interface for S3.
它是用于 S3 的多可用区、高可用性、可大规模扩展的 SFTP 接口。 With this basically you will running a cron or scheduler process to transfer the on prem SFTP server files into S3 buckets via AWS SFTP server.
基本上,您将运行一个 cron 或调度程序进程,以通过 AWS SFTP 服务器将本地 SFTP 服务器文件传输到 S3 存储桶中。
Documentation link - AWS Transfer Family
文档链接 - AWS Transfer 系列
The only catch here is the pricing for it.这里唯一的问题是它的定价。 It is little higher on the cost.
它的成本略高。 There are third party tools available with lesser price like SFTP Gateway for AWS which can be found in AWS marketplace
可以在 AWS 市场中找到价格较低的第三方工具,例如适用于 AWS 的 SFTP 网关
Documentation link - SFTP Gateway
文档链接 - SFTP 网关
Lastly, if your use case is simple with only very few SFTP uploads a day, solution would be to use T2/T3 EC2 instances and a cronjob to run the custom developed pipeline script that pulls data from on prem SFTP server.最后,如果您的用例很简单,每天只有很少的 SFTP 上传,解决方案是使用 T2/T3 EC2 实例和一个 cronjob 来运行自定义开发的管道脚本,该脚本从本地 SFTP 服务器上提取数据。
Assuming that you have a key file to connect to your AWS instance, you can use scp to specify it in the file transfer command:假设你有一个密钥文件连接到你的 AWS 实例,你可以使用 scp 在文件传输命令中指定它:
scp -i ~/.ssh/<aws_key>.pem <path_to_source_file> <aws_user>@<aws_ip>:<destination_path>
I'm planning to write a data pipeline that pull the data from on-prem SFTP server to S3.我打算编写一个数据管道,将数据从本地 SFTP 服务器拉到 S3。 How can I achieve this?
我怎样才能做到这一点? I am interested in AWS specific services only.
我只对 AWS 特定服务感兴趣。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.