![](/img/trans.png)
[英]How can I create a new column in a table to show only specific data from another column using SQL?
[英]How can i show hive table using pyspark
你好,我在 azure 上创建了一个 spark HD insight 集群,我正在尝试使用 pyspark 读取 hive 表,但问题是它只显示默认数据库
有人有想法吗?
如果您使用的是 HDInsight 4.0,Spark 和 Hive 将不再共享元数据。
默认情况下,您不会看到 pyspark 中的 hive 表,这是我在这篇文章中分享的一个问题: How save/update table in hive, to be readbale on spark 。
但是,无论如何,您可以尝试的事情:
这些更改将 hive 元存储目录定义为默认值。 您现在可以看到 hive 个数据库和表,但是根据表结构,您将无法正常看到表数据。
如果您在其他数据库中创建了表,请尝试show tables from database_name
。 将database_name
替换为实际名称。
您在 SparkSession 中缺少 hive 服务器的详细信息。 如果您没有添加任何内容,它将创建并使用默认数据库来运行 sparksql。
如果您已在spark.sql.warehouse.dir 和 spark.hadoop.hive.metastore.uris的 spark 默认配置文件中添加了配置详细信息,则在创建 SparkSession 时添加 enableHiveSupport()。
否则在创建 sparksession 时添加配置详细信息
.config("spark.sql.warehouse.dir","/user/hive/warehouse")
.config("hive.metastore.uris","thrift://localhost:9083")
.enableHiveSupport()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.