繁体   English   中英

DynamoDB 性能差/慢

[英]DynamoDB Poor/Slow Performance

我在 AWS Lambda 中有一个非常简单的网络服务,使用 Python 和 Flask(服务 A)。 该服务接收请求并执行 DynamoDB 查询并返回结果。 DynamoDB 具有按需容量,几乎在所有情况下都返回 1 个结果。

我使用以下 function 执行查询。

class DynamoDB:

    def __init__( self ):
        session = boto3.Session( )
        self.dynamodb = session.resource( 'dynamodb' )

    def query( self, table_name, **kwargs ):

        # Selected Table
        table = self.dynamodb.Table( table_name )

        # Request to table
        response = table.query( **kwargs )

        return response

查询表达式

"#user_id = :user_id and begins_with( #sort_key, :sort_key)" 

响应大小 ~ 400B

我遇到了一些性能问题,例如单个请求需要 1040 毫秒,AWS Lambda Memory 到 128MB,最大 Memory 用于 95-100 MB。 除了 DynamoDB 查询中消耗的 4 毫秒外,所有时间都是如此。

下面是我增加 memory 时的响应时间。

128  MB  -> 1040 ms
512  MB  -> 520  ms
1024 MB  -> 210  ms  

现在我在 AWS Lambda(服务 B)中有另一个网络服务,它使用 Python、Flask、Pandas 和 PyODBC。 该服务接收请求并对未托管在 AWS 中的 MSSQL 服务器执行 2 个简单查询并返回结果。 此服务有 128MB 的 Memory 和 Max Memory Used:128 MB(消耗所有内存)。 对该服务的单个请求的性能为 500 毫秒。

有人可以向我解释这怎么可能吗?

是否有任何解决方案可以使服务 A 中的查询更快?

一些可能对您有帮助的事情:

  • 您提供的 RAM 量不仅会影响计算,还会影响 Lambda function 的网络吞吐量,因此根据您的工作负载,这可能是一个限制。
  • 实例化 boto3 资源和客户端在计算方面通常相对昂贵,缓存这些资源绝对值得,以便节省几毫秒的时间——在我相对强大的笔记本上,实例化第一个150ms客户端或资源大约需要 150 毫秒,因为在第一次实例化时它读取并解析一些 JSON 描述并构建整个 object 层次结构,这需要一段时间。
  • 您可以考虑将 X-Ray SDK 添加到您的 function 并在其上启用 X-Ray。 这将使您更详细地了解应用程序的哪一部分以及哪个 API 调用花费了这么长时间。

编辑

男孩在第一次实例化 boto3 时确实 memory 大小很重要,我正在写一篇关于该方法的博客文章。 但如果 memory 参数非常小,在 lambda 冷启动后初始化第一个 boto3 客户端/资源似乎需要很长时间。

图形

我将ddb = DynamoDB()移到处理程序之外,并将 lambda function 的 memory 增加到 256MB。 因此,我将响应时间减少到 67 毫秒 - 75 毫秒。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM