我正在尝试使用以下代码通过 pyspark 访问我在 hdfs 中的文件:
spark = SparkSession.builder.appName("MongoDBIntegration").getOrCreate()
receipt = spark.read.json("hdfs:///bigdata/2.json")
我得到一个错误Incomplete HDFS URI, no host: hdfs:///bigdata/2.json
但是如果我写命令hdfs dfs -cat /bigdata/1.json
它会打印我的文件