java - 如何在 Spark Java 中将 RDD 字符串（xml 格式）转换为数据框？

翻译自：https://stackoverflow.com/questions/41457125 2017-01-04T06:00:31.147

1247 次

如果 xml 数据在文件中可用，则在下面的链接中提供了很好的解决方案， https://github.com/databricks/spark-xml

下面的代码通过加载物理文件将 xml 转换为 DataSet..

Dataset<Row> df = sqlContext.read().format("com.databricks.spark.xml")
                                   .option("rowTag", "book")
                                   .load("file:///C:/books.xml");

但是如果 JavaRdd 中有 xml 数据，那么如何转换成 Dataset？

java - 如何在 Spark Java 中将 RDD 字符串（xml 格式）转换为数据框？

0 回答 0

Related

Reference