簡體   English   中英

Spark2 Kafka結構化流式Java不知道from_json函數

[英]Spark2 Kafka Structured Streaming Java doesn't know from_json function

關於Kafka流上的Spark結構化流,我有一個問題。

我有一個類型的架構:

StructType schema = new StructType()
                .add("field1", StringType)
                .add("field2", StringType)
                .add("field3", StringType)
                .add("field4", StringType)
                .add("field5", StringType);

我從卡夫卡主題引導我的流,例如:

Dataset<Row> ds1 = spark
                .readStream()
                .format("kafka")
                .option("kafka.bootstrap.servers", "brokerlist")
                .option("zookeeper.connect", "zk_url")
                .option("subscribe", "topic")
                .option("startingOffsets", "earliest")
                .option("max.poll.records", 10)
                .option("failOnDataLoss", false)
                .load();

接下來轉換為字符串,字符串類型:

Dataset<Row> df1 = ds1.selectExpr("CAST(key AS STRING)", "CAST(value AS STRING)");

現在,我想將value字段(這是一個JSON)轉換為先前轉換的架構,這將使SQL查詢更加容易:

Dataset<Row> df2 = df1.select(from_json("value", schema=schema).as("data").select("single_column_field");

似乎Spark 2.3.1不知道from_json函數?

這是我的進口:

import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
import org.apache.spark.sql.streaming.OutputMode;
import org.apache.spark.sql.streaming.StreamingQueryException;
import org.apache.spark.sql.types.StructType;

關於如何解決這個問題的任何想法? 請注意,我不是在尋找Scala解決方案,而是在尋找純粹的基於Java的解決方案!

這段代碼對我有用。 希望對您有所幫助

val df = spark
  .readStream
  .format("kafka")
  .option("kafka.bootstrap.servers", "192.168.34.216:9092")
  .option("subscribe", "topicName")
  .load()
//df.show();
import spark.implicits._
val comingXDR = df.select("value").as[String].withColumn("_tmp", split($"value", "\\,")).withColumn("MyNewColumnName1", $"_tmp".getItem(0)).withColumn("MyNewColumnName2", $"_tmp".getItem(1)).withColumn("MyNewColumnName3", $"_tmp".getItem(2)).withColumn("MyNewColumnName4", $"_tmp".getItem(3)).drop("value").drop("_tmp")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM