0

我有一个场景,我正在从我的配置单元表中读取并创建一个 spark 数据框。我想从数据帧的输出中生成一个 xml 字符串并将其保存在一个新的数据帧中(作为 xml 字符串),而不是将其写入 HDFS 中的文件以创建 xml。请告诉我这是否可以使用 databricks spark-xml 来完成。

4

1 回答 1

1

您不能使用 spark-xml 库执行此操作,但您可以重用其中的写出部分来为 XmlRdd 创建您自己的解决方案:https ://github.com/databricks/spark-xml/blob/master/src/主/scala/com/databricks/spark/xml/util/XmlFile.scala

你可以在第 80 行找到这个。

于 2020-08-04T15:40:39.567 回答