[英]How to pipe data from AWS Postgres RDS to S3 (then Redshift)?
我正在使用AWS数据管道服务将数据从RDS MySql
数据库管道传输到s3
,然后再传输到Redshift
,效果很好。
但是,我也有数据存在于RDS Postres
实例中,我想以相同的方式进行管道RDS Postres
,但是我很难设置jdbc-connection。 如果不支持,是否有解决方法?
"connectionString": "jdbc:postgresql://THE_RDS_INSTANCE:5432/THE_DB”
如今,您可以定义一个复制活动,以将数据从Postgres RDS实例提取到S3中。 在数据管道界面中:
这还行不通。 aws hasnt尚未构建/发布了可以很好地连接到postgres的功能。 您可以通过shellcommandactivity来完成。 您可以编写一些ruby或python代码来做到这一点,然后使用scriptUri将其放在s3上的脚本中。 您还可以只编写一个psql命令以将表转储到csv,然后在该活动节点中通过“ staging:true”将其通过管道传输到OUTPUT1_STAGING_DIR。
像这样的东西:
{
"id": "DumpCommand",
"type": "ShellCommandActivity",
"runsOn": { "ref": "MyEC2Resource" },
"stage": "true",
"output": { "ref": "S3ForRedshiftDataNode" },
"command": "PGPASSWORD=password psql -h HOST -U USER -d DATABASE -p 5432 -t -A -F\",\" -c \"select blah_id from blahs\" > ${OUTPUT1_STAGING_DIR}/my_data.csv"
}
我没有运行它来进行验证,因为旋转管道很麻烦:(因此,请仔细检查命令中的转义。
查看刚刚在参数化模板数据管道上发布的AWS新东西: http : //docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-custom-templates.html 。 看起来它将允许加密任意参数。
AWS现在允许合作伙伴进行近实时RDS-> Redshift插入。
https://aws.amazon.com/blogs/aws/fast-easy-free-sync-rds-to-redshift/
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.