1

如果 xml 数据在文件中可用,则在下面的链接中提供了很好的解决方案, https://github.com/databricks/spark-xml

下面的代码通过加载物理文件将 xml 转换为 DataSet..

Dataset<Row> df = sqlContext.read().format("com.databricks.spark.xml")
                                   .option("rowTag", "book")
                                   .load("file:///C:/books.xml");

但是如果 JavaRdd 中有 xml 数据,那么如何转换成 Dataset?

4

0 回答 0