繁体   English   中英

如何使用 Python 创建具有生存时间的 Dataproc 集群 SDK

[英]How to create a Dataproc cluster with time to live using Python SDK

我尝试使用 python SDK 创建一个生存时间为 1 天的 Dataproc 集群 为此,Dataproc API 的 v1beta2 引入了LifecycleConfig object ,它是 ClusterConfig object 的子项。

我在传递给create_cluster方法的 JSON 文件中使用了这个 object。 要设置特定的 TTL,我使用字段auto_delete_ttl ,其值为 86,400 秒(一天)。

Google Protocol Buffers 的文档非常具体地说明了如何在 JSON 文件中表示持续时间:Durations shall be represented as string with suffix s for seconds 并且应该有 0、3、6 或 9 小数秒:



MergeFrom() 的参数必须是相同 class 的实例:预期的 google.protobuf.Duration 得到了 str


from google.cloud import dataproc_v1beta2
project = "your_project_id"
region = "europe-west4"
cluster = "" #see below for cluster JSON file
client = dataproc_v1beta2.ClusterControllerClient(client_options={
    'api_endpoint': '{}-dataproc.googleapis.com:443'.format(region)

# Create the cluster
operation = client.create_cluster(project, region, cluster)

变量 cluster 包含描述所需集群的 JSON object:

           "PIP_PACKAGES":"google-cloud-storage google-cloud-bigquery"
        "subnetwork_uri":"my subnet",
           "some tags"



我正在使用的 Package 版本:

  • 谷歌云数据处理:0.6.1
  • 协议缓冲区:3.11.3
  • googleapis-common-protos:1.6.0

我在这里做错了什么,这是错误的 package 版本的问题还是它甚至是一个错误?

当您以文本格式(即 json 等)构建 protobuf 时,您应该使用100s格式作为持续时间类型,但是您使用的是 Python object 来构建 API 请求主体,这就是为什么您需要创建持续时间 object而不是字符串:



声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

粤ICP备18138465号  © 2020-2024 STACKOOM.COM