[英]How can I convert a pyspark.sql.dataframe.DataFrame back to a sql table in databricks notebook
[英]How to convert sql table into a pyspark/python data structure and return back to sql in databricks notebook
我在databricks上运行sql笔记本。 我想分析一个包含五亿条记录的表。 我可以对数据运行简单的SQL查询。 但是,我需要将日期列类型从str更改为date。
不幸的是,sparkSQL似乎不支持update / alter语句,因此我似乎无法修改表中的数据。
可以让我在下一个单元格中将SQL表转换为python数据结构(在pyspark中)的一行代码是什么? 然后,我可以修改文件并将其返回给SQL。
dataFrame = sqlContext.sql('select * from myTable')
df=sqlContext.sql("select * from table")
要将数据框转换回sql视图,
df.createOrReplaceTempView("myview")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.