繁体 English 中英

如何在 Palantir Foundry 的 Code Workbook 中使用 sparkcontext 创建一个空数据集？

[英]How can I create an empty dataset using sparkcontext in Code Workbook in Palantir Foundry?

原文 2022-08-23 17:21:47 5 1 palantir-foundry

如何在代码工作簿中使用 spark 上下文创建一个最低限度的 pysaprk dataframe。 代码存储库中的等效命令如下：

my_df = ctx.spark_session.createDataFrame([('1',)], ["a"])

1 个解决方案

代码工作簿以 Spark session 的形式注入全局spark ，而不是ctx中的转换上下文。 您可以在 Python 变换中使用它（“新变换”>“Python 代码”）：

def my_dataframe():
    return spark.createDataFrame([('1',)], ["a"])

或使用已定义的架构：

from pyspark.sql import types as T
from datetime import datetime

SCHEMA = T.StructType([
    T.StructField('entity_name', T.StringType()),
    T.StructField('thing_value', T.IntegerType()),
    T.StructField('created_at', T.TimestampType()),
])

def my_dataframe():
    return spark.createDataFrame([("Name", 3, datetime.now())], SCHEMA)

如何从 Palantir Foundry 的 PySpark 模式创建一个空数据集？

[英]How can I create an empty dataset from on a PySpark schema in Palantir Foundry?

Palantir foundry 代码工作簿，从数据集中导出单个 xml

[英]Palantir foundry code workbook, export individual xmls from dataset

如何在 Palantir Foundry 中使用 Function 对多个属性进行分组？

[英]How can I groupby multiple properties using a Function in Palantir Foundry?

如何在代码工作簿中合并 Palantir Foundry 中的两个数据集？

[英]How do I union two datasets in Palantir Foundry within a code workbook?

如何在代码工作簿中加入 Palantir Foundry 中的两个数据集？

[英]How do I JOIN two datasets in Palantir Foundry within a code workbook?

如何将包含 250K 行的数据集转换为 Palantir Foundry 中的融合支持数据集？

[英]How can i convert a dataset which contains 250K rows into a fusion backed dataset in Palantir Foundry?

如何在 Palantir Foundry 的 Python 转换中传递数据集元数据，如 hash 或时间戳？

[英]How can I pass through dataset metadata, like a hash or timestamp, in a Python Transform in Palantir Foundry?

如何在 Palantir Foundry 中上传未经身份验证的数据集

[英]How to upload dataset without authentication in Palantir foundry

如何为时间戳列创建 Palantir Foundry Fusion 同步？

[英]How do I create a Palantir Foundry Fusion sync for a timestamp column?

如何在 Palantir Foundry Workshop 中创建累积和图？

[英]How do I create a cumulative sum graph in Palantir Foundry Workshop?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何从 Palantir Foundry 的 PySpark 模式创建一个空数据集？ Palantir foundry 代码工作簿，从数据集中导出单个 xml 如何在 Palantir Foundry 中使用 Function 对多个属性进行分组？如何在代码工作簿中合并 Palantir Foundry 中的两个数据集？如何在代码工作簿中加入 Palantir Foundry 中的两个数据集？如何将包含 250K 行的数据集转换为 Palantir Foundry 中的融合支持数据集？如何在 Palantir Foundry 的 Python 转换中传递数据集元数据，如 hash 或时间戳？如何在 Palantir Foundry 中上传未经身份验证的数据集如何为时间戳列创建 Palantir Foundry Fusion 同步？如何在 Palantir Foundry Workshop 中创建累积和图？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM