SqlServer 數據類型到 Hive 數據類型使用 Spark Scala

Question

Spark 用於從 SQL 服務器數據庫獲取表的架構。 由於數據類型不匹配，我在使用此模式創建 Hive 表時遇到問題。 我們如何在 Spark Scala 中將 SQL Server 數據類型轉換為 Hive 數據類型。

val df = sqlContext.read.format("jdbc")
  .option("url", "jdbc:sqlserver://host:port;databaseName=DB")
  .option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver")
  .option("dbtable", "schema.tableName")
  .option("user", "Userid").option("password", "pswd")
  .load().schema

Answer 1

謝謝，得到了解決方案。創建了一種檢查數據類型的方法，如下所示。

def sqlToHiveDatatypeMapping(inputDatatype: String): String = inputDatatype match {
  case "numeric" => "int"
  case "bit" => "smallint"
  case "long" => "bigint"
  case "dec_float" => "double"
  case "money" => "double" 
  case "smallmoney" => "double"  
  case "real" => "double"
  case "char" => "string" 
  case "nchar" => "string"  
  case "varchar" => "string"
  case "nvarchar" => "string"
  case "text" => "string"
  case "ntext" => "string"
  case "binary" => "binary"
  case "varbinary" => "binary"
  case "image" => "binary"
  case "date" => "date"
  case "datetime" => "timestamp"
  case "datetime2" => "timestamp"
  case "smalldatetime" => "timestamp"
  case "datetimeoffset" => "timestamp"
  case "timestamp" => "timestamp"
  case "time" => "timestamp"
  case "clob" => "string"
  case "blob" => "binary"
  case _ => "string"
}
val columns = df.fields.map({field => field.name.toLowerCase+" "+sqlToHiveDatatypeMapping(field.dataType.typeName.toLowerCase)}).mkString(",")

SqlServer 數據類型到 Hive 數據類型使用 Spark Scala

問題描述

1 個解決方案

解決方案1
1 2019-07-22 12:21:07

SqlServer 數據類型到 Hive 數據類型使用 Spark Scala

問題描述

1 個解決方案

解決方案1 1 2019-07-22 12:21:07

解決方案1
1 2019-07-22 12:21:07