繁体   English   中英

结构化流调试输入

[英]Structured streaming debugging input

我有办法打印出传入的数据吗? 例如,我在一个文件夹中有一个readStream在寻找JSON文件,但是由于在聚合输出中看到“空”,因此似乎存在问题。

val schema = StructType(
      StructField("id", LongType, false) ::
      StructField("sid", IntegerType, true) ::
      StructField("data", ArrayType(IntegerType, false), true) :: Nil)

val lines = spark.
      readStream.
      schema(schema).
      json("in/*.json")

val top1 = lines.groupBy("id").count()

val query = top1.writeStream
      .outputMode("complete")
      .format("console")
      .option("truncate", "false")
      .start()

要打印数据,可以在写入流中添加queryName,方法是使用该queryName进行打印。

在你的例子中

val query = top1.writeStream
      .outputMode("complete")
      .queryName("xyz")
      .format("console")
      .option("truncate", "false")
      .start()

运行此命令,即可使用SQL查询显示数据

%sql select * from xyz 

或者您可以创建数据框

val df = spark.sql("select * from xyz")

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM