簡體 English 中英

如何使用 aws 設計多客戶端預處理軟件管道？

[英]How to design multiclient preprocess software pipeline using aws?

原文 2020-05-16 07:45:42 9 1 python/ amazon-web-services/ design-patterns/ architecture

我的軟件目標是自動化預處理管道，管道有三個代碼塊：

獲取數據 - 通過 api 或通過客戶端將 csv 上傳到 s3 存儲桶。
處理數據——我的目標是將來自不同客戶端的數據統一到一個統一的端方案。
存儲方案是數據庫。 我知道這是一個非常常見的系統，但我找不到最適合它的設計。

要求是：

該系統不是實時的，對於每個客戶，我計划每 X 天獲取新數據，即使僅在一天后完成也沒關系
每個客戶端數據的處理部分都是唯一的，當然有一些共同的特征，但也有很多不同的特征和muniplation。
我希望系統是自動化的。

我想到了以下幾點：

The lambda solution: schedule a lambda for each client which will fetch the data every X days, the lambda will trigger another lambda which will do processing. 但是如果我有 100 個客戶端，那么處理 200 個 lambda 表達式會很糟糕。
2.1 制作一個名為 Api 的項目，並為每個客戶提供不同的腳本，我對 ec2 或 ecs 上的每個腳本都有一個 schudle。

2.2 有另一個項目調用處理，父class有公共代碼，所有子類客戶端代碼都繼承自它，API腳本將激活相關處理腳本。

最后，我很困惑什么是最佳實踐，我只找到了處理一個客戶端的示例，或者一個廣泛的通用方案方法/圖表塊。 因為我知道它是一個如此普遍的系統，所以我會很感激從其他人的經驗中學習。 將不勝感激任何參考鏈接或智慧

1 個解決方案

看一下Step Functions ，它將允許您解耦每個階段的執行並允許您重用您的 Lambda。

通過將輸入傳遞到步驟 function 頂部 Lambda 可能能夠做出提供給其他人的決策。

要安排此操作，請使用已安排的CloudWatch 事件

如何使用 sklearn 預處理管道中的標簽？

[英]How do you preprocess labels in a pipeline with sklearn?

如何使用python預處理Twitter文本數據

[英]How to preprocess twitter text data using python

Python中的多客戶端服務器-如何廣播？

[英]Multiclient server in Python - how to broadcast?

使用Tensorflow Dataset API讀取TFRecords文件時，預處理輸入數據會減慢輸入管道的速度

[英]Preprocess the input data slow down the input pipeline when using Tensorflow Dataset API to read TFRecords file

Elasticsearch 如何搜索文檔？ ES中如何自定義預處理管道和評分函數？

[英]How does Elasticsearch search documents? How to customize preprocess pipeline and scoring functions in ES?

當我使用管道對線性 svc 進行預處理、訓練和測試時，如何獲得最重要的特征系數？

[英]How to get most important feature coefficients when i used pipeline to preprocess, train and test the linear svc?

如何優化預處理所有文本文檔而不使用for循環在每次迭代中預處理單個文本文檔？

[英]How to optimize preprocess all text documents without using for loop to preprocess a single text document in each iteration?

如何預處理所有呼叫？

[英]How to preprocess all calls?

如何使用提供的需要 tf.Tensor 的 preprocess_input function 預處理 tf.data.Dataset？

[英]How can I preprocess a tf.data.Dataset using a provided preprocess_input function that expects a tf.Tensor?

如何使用NiBabel（Python）預處理NIfTI數據格式

[英]How to preprocess NIfTI data format using NiBabel (Python)

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何使用 sklearn 預處理管道中的標簽？如何使用python預處理Twitter文本數據 Python中的多客戶端服務器-如何廣播？使用Tensorflow Dataset API讀取TFRecords文件時，預處理輸入數據會減慢輸入管道的速度 Elasticsearch 如何搜索文檔？ ES中如何自定義預處理管道和評分函數？當我使用管道對線性 svc 進行預處理、訓練和測試時，如何獲得最重要的特征系數？如何優化預處理所有文本文檔而不使用for循環在每次迭代中預處理單個文本文檔？如何預處理所有呼叫？如何使用提供的需要 tf.Tensor 的 preprocess_input function 預處理 tf.data.Dataset？如何使用NiBabel（Python）預處理NIfTI數據格式

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM