簡體   English   中英

如何從表在Scala中創建數據框

[英]How to create dataframe in scala from tables

我正在嘗試為Scala中的兩個表創建一個dataframe ,並在嘗試運行時遇到syntax error Scala的新手。

import org.apache.spark.sql.{DataFrame, SparkSession}
import org.apache.spark.sql.functions._

object testfunction extends App {
val session = SparkSession.builder().master("local").getOrCreate()

import session.implicits._


val sqlContext = SQLContext(sc) 
val df1 = sqlContext.sql("select * from table1")
val df2 = sqlContext.sql("select * from table2")
//trying to call a function 
testfunction("key",df1,df2)
}

//// 
testfunction definition { .... }

如果我缺少任何導入功能,請告訴我,如果以上語法不正確,請更正我。 學習scala。 非常感謝您的回應。 錯誤:錯誤:未找到:值SQLContext val sqlContext = SQLContext(sc)

當前的處理方式如下:

val df = spark.read.json("/somepath/testweet.json")
df.createOrReplaceTempView("table1")
var df1 = spark.sql("select text from table1")
df1.printSchema()
df1.show()

您必須先使用val關鍵字聲明df1或df2才能使用它們。 請參閱此處以獲取更多信息: https : //spark.apache.org/docs/latest/sql-programming-guide.html

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM