簡體   English   中英

結構化流調試輸入

[英]Structured streaming debugging input

我有辦法打印出傳入的數據嗎? 例如,我在一個文件夾中有一個readStream在尋找JSON文件,但是由於在聚合輸出中看到“空”,因此似乎存在問題。

val schema = StructType(
      StructField("id", LongType, false) ::
      StructField("sid", IntegerType, true) ::
      StructField("data", ArrayType(IntegerType, false), true) :: Nil)

val lines = spark.
      readStream.
      schema(schema).
      json("in/*.json")

val top1 = lines.groupBy("id").count()

val query = top1.writeStream
      .outputMode("complete")
      .format("console")
      .option("truncate", "false")
      .start()

要打印數據,可以在寫入流中添加queryName,方法是使用該queryName進行打印。

在你的例子中

val query = top1.writeStream
      .outputMode("complete")
      .queryName("xyz")
      .format("console")
      .option("truncate", "false")
      .start()

運行此命令,即可使用SQL查詢顯示數據

%sql select * from xyz 

或者您可以創建數據框

val df = spark.sql("select * from xyz")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM