簡體   English   中英

過濾火花數據集

[英]Filtering a spark dataset

在火花會話中

val spark = SparkSession
  .builder()
  .appName("Spark SQL basic example")
  .config("spark.some.config.option", "some-value")
  .getOrCreate()

從數據集中

case class Coords(x: Option[Double],y: Option[Double])
val coords = spark.read.format("delta").load("<...>").select(col("x"), col("y")).as[Coords]

如何刪除那些“x”或“y”為空且“y”低於10的行?

非常感謝!

val res = coords
  .filter(col("x").isNotNull)
  .filter(col("y").isNotNull)
  .filter(col("y") >= 10)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM