簡體   English   中英

我想使用python boto3腳本將數據加載到Amazon Redshift集群中

[英]I want to load data into an Amazon Redshift Cluster using python boto3 script

我想使用boto3 Python腳本將數據加載到Amazon Redshift集群中。

我想使用boto3 python創建腳本來執行以下操作:

  1. 創建集群
  2. 將數據加載到集群中
  3. 創建有關集群性能的報告

我在boto3中看到沒有可用的方法將數據加載到集群中。 可能來自平面文件或S3。

如何使用boto3或任何其他python包將數據加載到群集中?

1.創建一個Amazon Redshift集群

調用create_cluster()命令。

2.將數據加載到集群中

Amazon Redshift的運行方式類似於普通的PostgreSQL v8.0.2數據庫。 要在數據庫本身上運行命令(包括COPY命令),應建立與數據庫的JDBC / ODBC連接。

請參閱: 使用SQL客戶端工具連接到Amazon Redshift集群-Amazon Redshift

一種常見的方法是使用psycopg2

conn = psycopg2.connect(...)
cur = conn.cursor()
cur.execute("COPY...")
conn.commit()

請參閱: 使用python和psycopg2將數據從S3復制到AWS redshift

3.創建有關集群性能的報告

績效報告有兩種信息來源:

請參閱: 監視Amazon Redshift群集性能-Amazon Redshift

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM