繁体   English   中英

如何使用scala中的spark xml解析器解析XML中的字符串?

[英]How to parse string in XML with spark xml parser in scala?

我尝试做的是使用XML解析器解析String。

我只是在scala中使用Spark来解析这种方法:

val df = sqlContext
  .read
  .format("com.databricks.spark.xml")
  .option("rowTag", "book")
  .load("books.xml")

我需要解析的是String,而不是文件

那么,是否有任何加载字符串(不是文件路径)的选项?

谢谢!

从下面的字符串创建RDD,

val xmlStringRDD = sc.parallelize(List("Your xml string"))

然后使用RDD如下

val df = new XmlReader().xmlRdd(spark.sqlContext(), xmlStringRDD);

其中 - spark是火花会议(来自Spark 2.0+)。

请注意:这个xmlRdd方法被讨论过不推荐使用,所以现在它可以工作,将来可能不会。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM