繁体   English   中英

如何在“AWS Step Functions”中共享数据而不在步骤之间传递数据

[英]How to share data in `AWS Step Functions` without passing it between the steps

我使用AWS Step Functions并具有以下工作流程

AWS Step Functions 工作流程

initStep - 这是一个 lambda 函数处理程序,它获取一些数据并将其发送到SQS以供外部服务。

activity = os.getenv('ACTIVITY')
queue_name = os.getenv('QUEUE_NAME')

def lambda_handler(event, context):
  event['my_activity'] = activity
  data = json.dumps(event)

  # Retrieving a queue by its name
  sqs = boto3.resource('sqs')
  queue = sqs.get_queue_by_name(QueueName=queue_name)

  queue.send_message(MessageBody=data, MessageGroupId='messageGroup1' + str(datetime.time(datetime.now())))

  return event

validationWaiting - 这是一个等待来自包含数据的外部服务的答案的activity

complete - 它是一个 lambda 函数处理程序,它使用来自initStep的数据。

def lambda_handler(event, context):
  email = event['email'] if 'email' in event else None
  data = event['data'] if 'data' in event else None

  client = boto3.client(service_name='ses')
  to = email.split(', ')
  message_conrainer = {'Subject': {'Data': 'Email from step functions'},
           'Body': {'Html': {
               'Charset': "UTF-8",
               'Data': """<html><body>
                            <p>""" + data """</p>
                            </body> </html> """
           }}}

  destination = {'ToAddresses': to,
               'CcAddresses': [],
               'BccAddresses': []}

  return client.send_email(Source=from_addresses,
                         Destination=destination,
                         Message=message_container)

它确实有效,但问题是我将完整数据从initStep发送到外部服务,只是为了稍后将其传递给complete 可能会添加更多步骤。

我相信最好将其作为某种全局数据(当前步骤函数的)共享,这样我就可以添加或删除步骤,并且数据仍然可供所有人使用。

您可以使用InputPathResultPath initStep您只会将必要的数据发送到外部服务(可能还有一些唯一的执行标识符)。 ValidaitonWaiting步骤中,您可以设置以下属性(在状态机定义中):

  • InputPath :将提供给GetActivityTask数据。 可能您想将其设置为$.execution_unique_id ,其中execution_unique_id是外部服务用于识别执行的数据中的字段(以在initStep期间将其与特定请求initStep )。
  • ResultPath : ValidationWaiting Activity 的输出将保存在数据中的位置。 您可以将其设置为$.validation_output并且来自外部服务的 json 结果将出现在那里。

通过这种方式,您可以仅将外部服务实际需要的数据发送到外部服务,并且您不会失去对之前(在ValidationWaiting步骤之前)输入中的任何数据的访问权限。

例如,您可以对状态机进行以下定义:

{
  "StartAt": "initStep",
  "States": {
    "initStep": {
      "Type": "Pass",
      "Result": {
        "executionId": "some:special:id",
        "data": {},
        "someOtherData": {"value": "key"}
      },
      "Next": "ValidationWaiting"
    },
    "ValidationWaiting": {
      "Type": "Pass",
      "InputPath": "$.executionId",
      "ResultPath": "$.validationOutput",
      "Result": {
        "validationMessages": ["a", "b"]
      },
      "Next": "Complete"
    },
    "Complete": {
      "Type": "Pass",
      "End": true
    }
  }
}

我已经使用initStepValidationWaiting Pass状态来简化示例(我没有运行它,但它应该可以工作)。 Result字段特定于Pass任务,它相当于您的 Lambda 函数或活动的结果。

在这种情况下, Complete步骤将获得以下输入:

{
  "executionId": "some:special:id",
  "data": {},
  "someOtherData": {"value": key"},
  "validationOutput": {
    "validationMessages": ["a", "b"]
  }
}

因此ValidationWaiting步骤的结果已保存到validationOutput字段中。

根据Marcin Sucharski的回答,我提出了自己的解决方案。

我需要使用Type: Task因为initStep是一个 lambda,它发送 SQS。

我不需要ValidationWaiting InputPath ,而只需要ResultPath ,它存储活动中收到的数据。

我使用无服务器框架,这是我的最终解决方案:

StartAt: initStep
States: 
  initStep:
    Type: Task
    Resource: arn:aws:lambda:#{AWS::Region}:#{AWS::AccountId}:function:init-step
    Next: ValidationWaiting
  ValidationWaiting:
    Type: Task
    ResultPath: $.validationOutput
    Resource: arn:aws:states:#{AWS::Region}:#{AWS::AccountId}:activity:validationActivity
    Next: Complete
    Catch:
      - ErrorEquals:
        - States.ALL
      ResultPath: $.validationOutput
      Next: Complete
  Complete:
    Type: Task
    Resource: arn:aws:lambda:#{AWS::Region}:#{AWS::AccountId}:function:complete-step
    End: true

这是一个简短而简单的 InputPath 和 ResultPath 解决方案。 我的 Lambda Check_Ubuntu_Updates 返回准备更新的实例列表。 此实例列表由步骤 Notify_Results 接收,然后使用此数据。 请记住,如果您的 Step Function 中有多个 ResultPath 并且您在一个步骤中需要超过 1 个输入,则您只能将 InputPath 与 $ 一起使用。

{
  "Comment": "A state machine that check some updates systems available.",
  "StartAt": "Check_Ubuntu_Updates",
  "States": {
    "Check_Ubuntu_Updates": {
      "Type": "Task",
      "Resource": "arn:aws:lambda:us-east-1:#############:function:Check_Ubuntu_Updates",
      "ResultPath": "$.instances",
      "Next": "Notify_Results"
    },
    "Notify_Results": {
      "Type": "Task",
      "InputPath": "$.instances",
      "Resource": "arn:aws:lambda:us-east-1:#############:function:Notify_Results",
      "End": true
    }
  }
}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM