DynamoDB 性能差/慢

Question

我在 AWS Lambda 中有一个非常简单的网络服务，使用 Python 和 Flask（服务 A）。 该服务接收请求并执行 DynamoDB 查询并返回结果。 DynamoDB 具有按需容量，几乎在所有情况下都返回 1 个结果。

我使用以下 function 执行查询。

class DynamoDB:

    def __init__( self ):
        session = boto3.Session( )
        self.dynamodb = session.resource( 'dynamodb' )

    def query( self, table_name, **kwargs ):

        # Selected Table
        table = self.dynamodb.Table( table_name )

        # Request to table
        response = table.query( **kwargs )

        return response

查询表达式

"#user_id = :user_id and begins_with( #sort_key, :sort_key)"

响应大小 ~ 400B

我遇到了一些性能问题，例如单个请求需要 1040 毫秒，AWS Lambda Memory 到 128MB，最大 Memory 用于 95-100 MB。 除了 DynamoDB 查询中消耗的 4 毫秒外，所有时间都是如此。

下面是我增加 memory 时的响应时间。

128  MB  -> 1040 ms
512  MB  -> 520  ms
1024 MB  -> 210  ms

现在我在 AWS Lambda（服务 B）中有另一个网络服务，它使用 Python、Flask、Pandas 和 PyODBC。 该服务接收请求并对未托管在 AWS 中的 MSSQL 服务器执行 2 个简单查询并返回结果。 此服务有 128MB 的 Memory 和 Max Memory Used：128 MB（消耗所有内存）。 对该服务的单个请求的性能为 500 毫秒。

有人可以向我解释这怎么可能吗？

是否有任何解决方案可以使服务 A 中的查询更快？

Answer 1

一些可能对您有帮助的事情：

您提供的 RAM 量不仅会影响计算，还会影响 Lambda function 的网络吞吐量，因此根据您的工作负载，这可能是一个限制。
实例化 boto3 资源和客户端在计算方面通常相对昂贵，缓存这些资源绝对值得，以便节省几毫秒的时间——在我相对强大的笔记本上，实例化第一个150ms客户端或资源大约需要 150 毫秒，因为在第一次实例化时它读取并解析一些 JSON 描述并构建整个 object 层次结构，这需要一段时间。
您可以考虑将 X-Ray SDK 添加到您的 function 并在其上启用 X-Ray。 这将使您更详细地了解应用程序的哪一部分以及哪个 API 调用花费了这么长时间。

编辑

男孩在第一次实例化 boto3 时确实 memory 大小很重要，我正在写一篇关于该方法的博客文章。 但如果 memory 参数非常小，在 lambda 冷启动后初始化第一个 boto3 客户端/资源似乎需要很长时间。

Answer 2

我将ddb = DynamoDB()移到处理程序之外，并将 lambda function 的 memory 增加到 256MB。 因此，我将响应时间减少到 67 毫秒 - 75 毫秒。

DynamoDB 性能差/慢

问题描述

2 个解决方案

解决方案1
3 2021-01-29 14:31:49

编辑

解决方案2
1 已采纳 2021-01-31 09:22:41

DynamoDB 性能差/慢

问题描述

2 个解决方案

解决方案1 3 2021-01-29 14:31:49

编辑

解决方案2 1 已采纳 2021-01-31 09:22:41

解决方案1
3 2021-01-29 14:31:49

解决方案2
1 已采纳 2021-01-31 09:22:41