[英]Scala: How can I return Option[Dataframe] of parquet file(which is in adls) - without using spark/sql session
DataFrame
是Spark的分布式数据集合之一; Spark创建分布式集合的唯一方法是通过有效的SparkSession
。 没有它就无法创建一个DataFrame
。
您提供的链接显示了如何将Parquet文件加载到非分布式集合中,而不是加载到DataFrame
。
SparkSession
的最简单类型是本地的 ,Spark的所有组件实际上都在进程内运行。 这意味着此会话不需要任何配置设置(没有在任何地方运行或安装现有的Spark进程)。 这主要对测试有用,但可能对您的用例有用。 创建方法如下:
import org.apache.spark.sql.SparkSession
val spark = SparkSession.builder.appName("test").master("local").getOrCreate
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.