如何从本地 pyspark 程序连接和加载远程 BigInsights HDFS(启用 kerberos 身份验证)中的文件进行处理?
df = sqlContext.read.parquet("hdfs://<<remote_hdfs_host>>:8020/testDirectory")
帮助将不胜感激。
如何从本地 pyspark 程序连接和加载远程 BigInsights HDFS(启用 kerberos 身份验证)中的文件进行处理?
df = sqlContext.read.parquet("hdfs://<<remote_hdfs_host>>:8020/testDirectory")
帮助将不胜感激。