簡體   English   中英

Scala:如何返回鑲木地板文件的選項[Dataframe](位於adls中)-不使用spark / sql會話

[英]Scala: How can I return Option[Dataframe] of parquet file(which is in adls) - without using spark/sql session

以下鏈接可能是提示,但是很高興看到一些執行此操作的示例代碼

從Scala讀取Parquet文件而不使用Spark

DataFrame是Spark的分布式數據集合之一; Spark創建分布式集合的唯一方法是通過有效的SparkSession 沒有它就無法創建一個DataFrame

您提供的鏈接顯示了如何將Parquet文件加載到非分布式集合中,而不是加載到DataFrame

SparkSession的最簡單類型是本地的 ,Spark的所有組件實際上都在進程內運行。 這意味着此會話不需要任何配置設置(沒有在任何地方運行或安裝現有的Spark進程)。 這主要對測試有用,但可能對您的用例有用。 創建方法如下:

import org.apache.spark.sql.SparkSession

val spark = SparkSession.builder.appName("test").master("local").getOrCreate

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM