如果 xml 数据在文件中可用,则在下面的链接中提供了很好的解决方案, https://github.com/databricks/spark-xml
下面的代码通过加载物理文件将 xml 转换为 DataSet..
Dataset<Row> df = sqlContext.read().format("com.databricks.spark.xml")
.option("rowTag", "book")
.load("file:///C:/books.xml");
但是如果 JavaRdd 中有 xml 数据,那么如何转换成 Dataset?