繁体   English   中英

无法使用 azure 中的 pyspark 访问表

[英]Cannot access to the table with pyspark in azure

我在 azure 突触中创建了一个带有表的数据库,这是样本 azure 数据的外部表。

在此处输入图像描述

我运行下面的代码以通过 pyspark 访问此表中的数据

df = spark.sql("select * FROM greentaxidb.dbo.taxitable")

当我运行上面的代码时,我得到:

pyspark.sql.utils.AnalysisException: The namespace in session catalog must have exactly one name part: greentaxidb.dbo.taxitable

使用 saveAsTable 将数据加载到 dataframe 以在 pyspark 笔记本中运行。

%%pyspark
df = spark.read.load('abfss://<container-name>@<storage-account-name>.dfs.core.windows.net/<filename>', format='parquet')
df.write.mode("overwrite").saveAsTable("testdb.test1")

--

%%pyspark
df = spark.sql("select * from testdb.test1")
display(df)

在此处输入图像描述

您可以通过此处此处的链接了解更多详细信息,go。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM