簡體 English 中英

如何在 Palantir Foundry 的 Code Workbook 中使用 sparkcontext 創建一個空數據集？

[英]How can I create an empty dataset using sparkcontext in Code Workbook in Palantir Foundry?

原文 2022-08-23 17:21:47 8 1 palantir-foundry

如何在代碼工作簿中使用 spark 上下文創建一個最低限度的 pysaprk dataframe。 代碼存儲庫中的等效命令如下：

my_df = ctx.spark_session.createDataFrame([('1',)], ["a"])

1 個解決方案

代碼工作簿以 Spark session 的形式注入全局spark ，而不是ctx中的轉換上下文。 您可以在 Python 變換中使用它（“新變換”>“Python 代碼”）：

def my_dataframe():
    return spark.createDataFrame([('1',)], ["a"])

或使用已定義的架構：

from pyspark.sql import types as T
from datetime import datetime

SCHEMA = T.StructType([
    T.StructField('entity_name', T.StringType()),
    T.StructField('thing_value', T.IntegerType()),
    T.StructField('created_at', T.TimestampType()),
])

def my_dataframe():
    return spark.createDataFrame([("Name", 3, datetime.now())], SCHEMA)

如何從 Palantir Foundry 的 PySpark 模式創建一個空數據集？

[英]How can I create an empty dataset from on a PySpark schema in Palantir Foundry?

Palantir foundry 代碼工作簿，從數據集中導出單個 xml

[英]Palantir foundry code workbook, export individual xmls from dataset

如何在 Palantir Foundry 中使用 Function 對多個屬性進行分組？

[英]How can I groupby multiple properties using a Function in Palantir Foundry?

如何在代碼工作簿中合並 Palantir Foundry 中的兩個數據集？

[英]How do I union two datasets in Palantir Foundry within a code workbook?

如何在代碼工作簿中加入 Palantir Foundry 中的兩個數據集？

[英]How do I JOIN two datasets in Palantir Foundry within a code workbook?

如何將包含 250K 行的數據集轉換為 Palantir Foundry 中的融合支持數據集？

[英]How can i convert a dataset which contains 250K rows into a fusion backed dataset in Palantir Foundry?

如何在 Palantir Foundry 的 Python 轉換中傳遞數據集元數據，如 hash 或時間戳？

[英]How can I pass through dataset metadata, like a hash or timestamp, in a Python Transform in Palantir Foundry?

如何在 Palantir Foundry 中上傳未經身份驗證的數據集

[英]How to upload dataset without authentication in Palantir foundry

如何為時間戳列創建 Palantir Foundry Fusion 同步？

[英]How do I create a Palantir Foundry Fusion sync for a timestamp column?

如何在 Palantir Foundry Workshop 中創建累積和圖？

[英]How do I create a cumulative sum graph in Palantir Foundry Workshop?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何從 Palantir Foundry 的 PySpark 模式創建一個空數據集？ Palantir foundry 代碼工作簿，從數據集中導出單個 xml 如何在 Palantir Foundry 中使用 Function 對多個屬性進行分組？如何在代碼工作簿中合並 Palantir Foundry 中的兩個數據集？如何在代碼工作簿中加入 Palantir Foundry 中的兩個數據集？如何將包含 250K 行的數據集轉換為 Palantir Foundry 中的融合支持數據集？如何在 Palantir Foundry 的 Python 轉換中傳遞數據集元數據，如 hash 或時間戳？如何在 Palantir Foundry 中上傳未經身份驗證的數據集如何為時間戳列創建 Palantir Foundry Fusion 同步？如何在 Palantir Foundry Workshop 中創建累積和圖？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM