简体   繁体   English

AWS | 从 SFTP 拉取数据

[英]AWS | Data pull from SFTP

I'm planning to write a data pipeline that pull the data from on-prem SFTP server to S3.我打算编写一个数据管道,将数据从本地 SFTP 服务器拉到 S3。 How can I achieve this?我怎样才能做到这一点? I am interested in AWS specific services only.我只对 AWS 特定服务感兴趣。

AWS provides a native way to transfer your files from any on-prem servers to s3 directly AWS Transfer Family . AWS 提供了一种本地方式,可以将您的文件从任何本地服务器直接传输到 s3 AWS Transfer Family It is a multi-AZ, highly available, massively scaling SFTP interface for S3.它是用于 S3 的多可用区、高可用性、可大规模扩展的 SFTP 接口。 With this basically you will running a cron or scheduler process to transfer the on prem SFTP server files into S3 buckets via AWS SFTP server.基本上,您将运行一个 cron 或调度程序进程,以通过 AWS SFTP 服务器将本地 SFTP 服务器文件传输到 S3 存储桶中。

Documentation link - AWS Transfer Family文档链接 - AWS Transfer 系列

The only catch here is the pricing for it.这里唯一的问题是它的定价。 It is little higher on the cost.它的成本略高。 There are third party tools available with lesser price like SFTP Gateway for AWS which can be found in AWS marketplace可以在 AWS 市场中找到价格较低的第三方工具,例如适用于 AWS 的 SFTP 网关

Documentation link - SFTP Gateway文档链接 - SFTP 网关

Lastly, if your use case is simple with only very few SFTP uploads a day, solution would be to use T2/T3 EC2 instances and a cronjob to run the custom developed pipeline script that pulls data from on prem SFTP server.最后,如果您的用例很简单,每天只有很少的 SFTP 上传,解决方案是使用 T2/T3 EC2 实例和一个 cronjob 来运行自定义开发的管道脚本,该脚本从本地 SFTP 服务器上提取数据。

Assuming that you have a key file to connect to your AWS instance, you can use scp to specify it in the file transfer command:假设你有一个密钥文件连接到你的 AWS 实例,你可以使用 scp 在文件传输命令中指定它:

scp -i ~/.ssh/<aws_key>.pem <path_to_source_file> <aws_user>@<aws_ip>:<destination_path>

I'm planning to write a data pipeline that pull the data from on-prem SFTP server to S3.我打算编写一个数据管道,将数据从本地 SFTP 服务器拉到 S3。 How can I achieve this?我怎样才能做到这一点? I am interested in AWS specific services only.我只对 AWS 特定服务感兴趣。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 BigQuery 从 sftp 检索数据 - BigQuery retrieve data from sftp 我可以使用现有资源“aws_cloudwatch_event_rule”中的数据块提取信息吗? - Can I pull information using a block of data from an existing resource "aws_cloudwatch_event_rule"? 连接到 AWS Transfer for SFTP - Connecting to AWS Transfer for SFTP 将大量数据从 Snowflake 数据库提取到 AWS SageMaker 的最快方法是什么? - What is the fastest way to pull massive amounts of data from Snowflake Database into AWS SageMaker? 尝试从 aws 存储库中提取代码时出现 403 错误 - 403 error when try to pull code from aws repository 使用 Fargate 使用 AWS ECS 任务从 SFTP 服务器并行获取文件 - Fetch files parallelly from an SFTP server using AWS ECS tasks using Fargate 使用 Python pysftp 从 SFTP 下载文件并直接存储在 AWS S3 中 - Using Python pysftp download files from SFTP and store directly in AWS S3 使用 Cloud Data Fusion 将数据从 SFTP 提取到 GCS 或 BigQuery 时出错 - Error while Data Ingestion from SFTP to GCS or BigQuery using Cloud Data Fusion 通过骆驼将 sftp 移动到 AWS 后在 sftp 上连接时出现问题 - Having problem to connect on sftp after moving sftp to AWS through camel 在 AWS Fargate 上运行的容器中提取 AWS 凭证 - Pull AWS credentials in container running on AWS Fargate
 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM