[英]Is it possible to choose the S3 directory I want to store my pipeline run files?
我的管道运行目录是在我的默认存储桶目录中创建的,它变得越来越乱。 我一直在尝试在我的 s3 默认存储桶中设置一个子目录来存储我所有的管道运行目录(PreProcess、Train、Evaluate、Interpret...),但我还没有成功。 有人可以帮我做吗?
我尝试将我的步骤名称从 CrossPreprocess-Data 更改为 sagemaker/cross-project/CrossPreprocess-Data 并且成功了。 它在 dir sagemaker/cross-project 中创建了我的管道目录
step_process = ProcessingStep(
name="sagemaker/cross-project/CrossPreprocess-Data",
processor=sklearn_processor,
outputs=[
ProcessingOutput(output_name="train", source="/opt/ml/processing/train"),
ProcessingOutput(output_name="validation", source="/opt/ml/processing/val"),
ProcessingOutput(output_name="test", source="/opt/ml/processing/test"),
ProcessingOutput(output_name="metafiles", source="/opt/ml/processing/metafiles"),
],
code=os.path.join(BASE_DIR, "preprocess.py"),
job_arguments=["--input-data", input_data, "--run-datetime", run_datetime, "--project-name", project_name],
)
但是,在下一步中,我收到了这个错误,我无法继续执行
ClientError: An error occurred (ValidationException) when calling the UpdatePipeline operation: Unable to parse pipeline definition. Invalid property reference 'Steps.sagemaker/cross-project/CrossPreprocess-Data.ProcessingOutputConfig.Outputs['train'].S3Output.S3Uri' in GetFunction definition.
您可以在ProcessingOutput
中设置目标以指定您的文件应保存到 S3 存储桶中的哪个位置。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.