繁体   English   中英

如何在 Pyspark 中处理包含 SQL 逻辑的 Table.column

[英]How to process a Table.column which contains a SQL logic in Pyspark

例如:

表 - 映射表

Col1 Col2 映射逻辑
SELECT * 来自 TableX
SELECT * FROM TableX X Left Outer Join TableY Y on X.id=Y.ID

其他表 - TableX 和 TableY

如何在 Pyspark dataframe 中使用此映射表并使用 MappingLogic 列构建我的逻辑?

不确定您期待什么样的答案,但通常您可以在pyspark代码中使用 sql 表达式。 你只需要先在你的表上创建视图:

spark.read \
    .jdbc("jdbc:postgresql:dbserver", "tableX",
          properties={"user": "username", "password": "password"}).createOrReplaceTempView("tableX")

# Later you get sql-expression from your mapping logic table and execute it:
s = "SELECT * FROM TableX"
df = spark.sql(s)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM