[英]How to process a Table.column which contains a SQL logic in Pyspark
例如:
表 - 映射表
Col1 | Col2 | 映射逻辑 |
---|---|---|
一 | 二 | SELECT * 来自 TableX |
一 | 二 | SELECT * FROM TableX X Left Outer Join TableY Y on X.id=Y.ID |
其他表 - TableX 和 TableY
如何在 Pyspark dataframe 中使用此映射表并使用 MappingLogic 列构建我的逻辑?
不确定您期待什么样的答案,但通常您可以在pyspark
代码中使用 sql 表达式。 你只需要先在你的表上创建视图:
spark.read \
.jdbc("jdbc:postgresql:dbserver", "tableX",
properties={"user": "username", "password": "password"}).createOrReplaceTempView("tableX")
# Later you get sql-expression from your mapping logic table and execute it:
s = "SELECT * FROM TableX"
df = spark.sql(s)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.