[英]Filtering a spark dataset
在火花會話中
val spark = SparkSession
.builder()
.appName("Spark SQL basic example")
.config("spark.some.config.option", "some-value")
.getOrCreate()
從數據集中
case class Coords(x: Option[Double],y: Option[Double])
val coords = spark.read.format("delta").load("<...>").select(col("x"), col("y")).as[Coords]
如何刪除那些“x”或“y”為空且“y”低於10的行?
非常感謝!
val res = coords
.filter(col("x").isNotNull)
.filter(col("y").isNotNull)
.filter(col("y") >= 10)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.