[英]Scala: How can I return Option[Dataframe] of parquet file(which is in adls) - without using spark/sql session
DataFrame
是Spark的分布式數據集合之一; Spark創建分布式集合的唯一方法是通過有效的SparkSession
。 沒有它就無法創建一個DataFrame
。
您提供的鏈接顯示了如何將Parquet文件加載到非分布式集合中,而不是加載到DataFrame
。
SparkSession
的最簡單類型是本地的 ,Spark的所有組件實際上都在進程內運行。 這意味着此會話不需要任何配置設置(沒有在任何地方運行或安裝現有的Spark進程)。 這主要對測試有用,但可能對您的用例有用。 創建方法如下:
import org.apache.spark.sql.SparkSession
val spark = SparkSession.builder.appName("test").master("local").getOrCreate
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.