繁体   English   中英

使用 python 在 Databricks 中截断增量表

[英]Truncate delta table in Databricks using python

此处针对 Python 和 SQL 给出了增量表删除操作。 此处给出了使用 SQL 进行截断。 但找不到 Python 截断表的文档。 如何为 Databricks 中的增量表执行此操作?

对于 Python 或 Java/Scala,并非所有内容都公开为 function。 有些操作是仅限 SQL 的,例如OPTIMIZE 如果要截断表,有两种选择:

  1. 利用
spark.sql("TRUNCATE TABLE <name>")

或者

spark.sql("TRUNCATE TABLE delta.`<path>`")
  1. 在覆盖模式下使用读 + 写空 dataframe 模拟截断:
df = spark.read.format("delta").load("<path>")
df.limit(0).write.mode("overwrite").format("delta").save("<path>")
query = "TRUNCATE TABLE <name>"

sqlContext.sql(query)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM