簡體   English   中英

Spark JDBC僅返回帶有列名的數據幀

[英]Spark JDBC returning dataframe only with column names

我正在嘗試使用 spark JDBC 連接到 HiveTable,代碼如下:

val df = spark.read.format("jdbc").
  option("driver", "org.apache.hive.jdbc.HiveDriver").
  option("user","hive").
  option("password", "").
  option("url", jdbcUrl).
  option("dbTable", tableName).load()

df.show()

但我得到的回報只是一個帶有修改列名的空數據框,如下所示:

--------------|---------------|
tableName.uuid|tableName.name |
--------------|---------------|

我嘗試以多種方式讀取數據框,但結果總是相同。 我正在使用 JDBC Hive 驅動程序,並且此 HiveTable 位於 EMR 集群中。 代碼也在同一個集群中運行。 任何幫助將不勝感激。 謝謝你們。

請在選項中設置 fetchsize 它應該可以工作。

Dataset<Row> referenceData
            = sparkSession.read()
            .option("fetchsize", "100")
            .format("jdbc")
            .option("url", jdbc.getJdbcURL())
            .option("user", "")
            .option("password", "")
            .option("dbtable", hiveTableName).load();

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM