pyspark - 如何从本地 pyspark 程序连接和加载远程 BigInsights HDFS（启用 kerberos 身份验证）中的文件进行处理？

问问题 2017-03-17T12:43:53.990

182 次

如何从本地 pyspark 程序连接和加载远程 BigInsights HDFS（启用 kerberos 身份验证）中的文件进行处理？

df = sqlContext.read.parquet("hdfs://<<remote_hdfs_host>>:8020/testDirectory")

帮助将不胜感激。

0 回答 0