簡體   English   中英

使用現有數據在 Redshift 集群上啟用加密

[英]Enabling Encryption on a Redshift Cluster with existing data

我負責在擁有大量現有數據的 Redshift 集群上啟用加密。 基於此鏈接,我知道啟用后,它將創建一個新集群並復制現有數據,以便在這段時間內以只讀方式訪問它。 我們有許多針對 Redshift 集群運行的 ETL 作業,我正在嘗試確定大概需要多長時間進行遷移。 是否有任何基於數據大小/節點類型/集群配置的估算可用?

是否有基於數據大小/節點類型/集群配置的估計?

基本上沒有 花費的時間將取決於許多因素,其中一些是您無法控制的,因此很難預測。

您應該首先進行絕對測試,以便了解其含義以及可能需要花費的時間,例如

  • 通過還原原始群集的快照來創建新的相同群集
  • 請按照以下步驟對集群進行加密並記錄所花費的時間
  • 理想情況下,使用加密集群測試您現有的ETL作業
  • 刪除測試集群

根據我調整群集大小的經驗(類似但不同的練習),由於本地AWS資源,網絡流量等的可變性,我會允許您的測試時間有+/- 10-15%的余量。

如果可能的話,我建議終止與群集的所有連接,以加快該過程。 我們發現一個頻繁輪詢集群的過程導致調整大小過程花費了更長的時間。

對於參考點,大約20個節點的ds群集。 25 Tb的數據大約需要20個小時來調整大小。

在非加密集群上啟用加密需要很多時間,例如:-2 tb 集群需要 50 小時,我們不能為我們的 etl 工作保留這么多時間

我們還有其他方法可以啟用加密嗎?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM