簡體 English 中英

Lambda with DynamoDB觸發器在表上具有超過500000個不同值的分區鍵

[英]Lambda with DynamoDB Trigger on a table Partition Key with more than 500000 distinct values

原文 2019-06-19 02:23:56 0 2 aws-lambda/ amazon-dynamodb/ amazon-dynamodb-streams/ amazon-dynamodb-data-modeling

我們目前正在設計一個dynamodb表來存儲某些文件屬性。 有2個主要欄目

日期： - 包含YYMMDD格式的日期，例如：-20190618
FileName： - xxxxxxxxxxx.json

目前，分區鍵是Date，排序鍵是FileName。 我們預計每天大約有500000個文件具有不同的文件名（這可能會在一段時間內增加）。 文件名將每天重復相同，即典型的模式如下所示

Date FileName 20190617 abcd.json 20190618 abcd.json

我們有一系列基於Date和dynamodb觸發器的查詢。 查詢工作得很好。 目前我們觀察到的是並發lambda執行的數量限制為2，因為我們是按日期分區。 在嘗試改善lambda的並發性時，我們遇到了兩個解決方案

1）參考以下鏈接（ https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/bp-partition-key-sharding.html ），一個想法是為Date Field添加固定數量的隨機后綴，即（20190617.1到20190617.500）將數據拆分為500個分區，每個分區有1000條記錄。 這將確保一定程度的並發性，並且對查詢的更改也很少

2）第二個選項是更改表的分區，如下所示：分區鍵： - FileName和SortKey： - Date。 這將導致大約500000個分區（可以增加）。 對於按日期查詢，我們需要添加一個GSI，但我們將在Lambda中實現更多的並發性

我們還沒有創建一個包含500000個分區的表（可以增加）。 任何機構都有這樣的經歷......如果有，請評論

任何幫助表示贊賞

2 個解決方案

您似乎錯誤地認為分區鍵和分區之間存在一對一的對應關系。

不是這種情況。

分區數由表大小和吞吐量驅動。 分區鍵由DDB進行散列，數據存儲在特定分區中。

您可以擁有100k分區密鑰，只有一個分區。

如果你正在推動DDB的限制，那么你可能最終只能在一個分區中使用一個分區鍵...但這不是典型的。

DDB白皮書提供了DDB如何工作的一些細節......

如果您的訪問模式是按日期查詢，則按文件名分區並沒有多大意義。

相反，通過添加后綴來增加每個日期的分區數的想法似乎很好。 但是，您可以考慮根據文件名添加穩定的后綴，而不是添加隨機后綴：

你可以使用文件名的第一個字母來獲得大約30個分區 - 假設文件名是隨機的。 唯一的麻煩是某些字母可能比其他字母更為常見，從而產生偏差的子分區

或者，您可以獲取文件名的哈希值，並將其用作分區鍵的后綴。 散列函數可以是一個相對簡單的散列函數，它產生一個目標數值，該值對應於您希望為每個日期分配的子分區數。

如果每個分區最終得到大約10000-50000個項目，那么它可能會很棒。

希望這可以幫助

如何使用 boto3(lambda) 對 AWS dynamodb 表進行分組並獲取分區鍵的最新值？

[英]how to group AWS dynamodb table and get latest value of partition key using boto3(lambda)?

在 dynamodb 表上觸發 lambda 以發送電子郵件

[英]Trigger lambda on dynamodb table to send email

是否可以使用多個dynamodb表

[英]Is it possible to use more than one dynamodb table

在DynamoDB上批量觸發Lambda

[英]Batching trigger Lambda on DynamoDB

DynamoDB觸發Lambda函數

[英]DynamoDB trigger Lambda Function

使用 Lambda 在 DynamoDB 上批量寫入超過 25 個項目

[英]Batch write more than 25 items on DynamoDB using Lambda

如何為巨大的靜態 dynamodb 表中的每個項目觸發 lambda

[英]How to trigger lambda for each item in a huge static dynamodb table

從 lambda function 代碼中識別觸發器或查找 dynamodb 表名

[英]Identify trigger or find dynamodb table name from lambda function code

如何擁有兩個以上的觸發Lambda的DynamoDB流

[英]How to have more than two DynamoDB Streams that trigger lambdas

如何實現 Lambda 觸發器在全局 dynamoDb 表上觸發一次

[英]How to implement a Lambda trigger to fire once on a global dynamoDb table

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何使用 boto3(lambda) 對 AWS dynamodb 表進行分組並獲取分區鍵的最新值？在 dynamodb 表上觸發 lambda 以發送電子郵件是否可以使用多個dynamodb表在DynamoDB上批量觸發Lambda DynamoDB觸發Lambda函數使用 Lambda 在 DynamoDB 上批量寫入超過 25 個項目如何為巨大的靜態 dynamodb 表中的每個項目觸發 lambda 從 lambda function 代碼中識別觸發器或查找 dynamodb 表名如何擁有兩個以上的觸發Lambda的DynamoDB流如何實現 Lambda 觸發器在全局 dynamoDb 表上觸發一次

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM