繁体   English   中英

如何使用databrick将属性和值添加到scala(spark)中的xml标签

[英]How to add attribute and value to xml tag in scala(spark) by using databrick

我需要使用数据块在 spark scala 中添加“xml:lang”作为属性和“衬衫”作为值。 请帮忙。 例如 - <display-name xml:lang="x-default">Shirt</display-name>

一种方法是使用 databricks spark-xml 库,如下所示:

  1. 将 spark-xml 库导入您的工作区或
  2. 将库附加到集群

在此处输入图像描述

  1. 使用笔记本中的以下代码读取 xml 文件,其中“note”是我的 xml 文件的根。

xmldata = spark.read.format('xml').option("rootTag","note").load('dbfs:/mnt/mydatafolder/xmls/note.xml') 显示(xmldata)

例子:

在此处输入图像描述

有关详细信息,请参阅“ Apache Spark 的 XML 数据源”。

希望这可以帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM