繁体   English   中英

在 Palantir Foundry 中,我应该如何在转换中获取当前的 SparkSession?

[英]In Palantir Foundry, how should I get the current SparkSession in a Transform?

我正在编写一个 Python 转换并且需要获取 SparkSession,以便我可以构造一个 DataFrame。

我该怎么做?

您可以在转换中将 SparkContext 作为参数传递,然后可以使用它来生成 SparkSession。

@transform(
    output=Output('/path/to/first/output/dataset'),
)
def my_compute_function(ctx, output):
    # type: (TransformContext, TransformOutput) -> None

    # In this example, the Spark session is used to create an empty data frame.
    columns = [
        StructField("col_a", StringType(), True)
    ]
    empty_df = ctx.spark_session.createDataFrame([], schema=StructType(columns))

    output.write_dataframe(empty_df)

此示例也可以在此处的 Foundry 文档中找到: https ://www.palantir.com/docs/foundry/transforms-python/transforms-python-api/#transform

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM