我在 Apache Spark 中有一个带有数据块和 xml 的程序。
object leerDatos {
def main(args: Array[String]): Unit = {
val spark = SparkSession.builder
.master("local[*]")
.appName("LeerDatos")
.getOrCreate()
val df = spark.read.option("rowTag", "pm")
.format("com.databricks.spark.xml")
.load("/home/example.xml")
df.show()
XML 文件手动位于我的电脑中,并且显示正确。
但是,我想从 Https 方向读取一个 XML 文件
val df = spark.read.option("rowTag", "pm")
.format("com.databricks.spark.xml")
.load("http://urlexample.com/example/example.xml")
df.show()
此代码显示错误:
Exception in thread "main" java.io.IOException: No FileSystem for scheme: https