[英]dynamodb vs aws s3 for timeseries data
我的數據模型如下:時間戳,值
這當前存儲在s3中的csv文件中,客戶端下載並使用它將值附加到某些數據上,模型如下:時間戳,名稱
最終文件是時間戳,名稱,值
將所有數據模型存儲在dynamodb表中並通過時間戳查找每個數據模型會更快嗎?
我的問題是我們會查找100-20k的記錄,我不確定發電機會如何處理。 如果整個文件位於客戶端,大約3MB,那么可以在本地完成。
此文件現在為3MB,但隨着時間的推移,它將通過預定的lambda函數增長。 我並不關心強大的寫作,只需要它最終是一致的。
此外,如果數據是發電機,那么我可以在lambda中附加值而不是在客戶端執行。 如果發電機太慢,這可能會使lambda超時。
我已經將DynamoDb用於類似的用例,並且它工作得非常好,將項目放在DynamoDb表中花了不到一秒鍾。
如果將Lambda函數和DynamoDb放在同一區域中會更快。
另外,根據優化事務的用例,考慮DynamoDb表(分區鍵和排序鍵)的結構。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.