5

我是 python 新手,我正在尝试连接 Hadoop HDFS 系统。我得到了以下参考代码,我试图实现它,但在导入包时显示错误。

from pyarrow import HdfsClient

# Using libhdfs
hdfs = HdfsClient('192.168.0.119', '50070', 'cloudera', driver='libhdfs')

错误:ImportError:无法导入名称“HdfsClient”

我什至尝试使用“ pip ”安装它,但是

找不到满足 HdfsClient 要求的版本(来自版本:)找不到 HdfsClient 的匹配分发

然后我尝试使用“ conda ”,但又一次

收集包元数据:完成解决环境:失败

PackagesNotFoundError:当前频道不提供以下软件包:

  • hdfs客户端

当前频道:

要搜索可能提供您正在寻找的 conda 包的替代频道,请导航至

https://anaconda.org

并使用页面顶部的搜索栏。

实际上我正在尝试使用以下方式连接到 HUE:

IP 地址 -> 192.168.0.119

端口名称 -> 50070

用户名 -> cloudera

密码-> cloudera

但这行不通。任何人都可以建议以更好的方式连接它或如何在 Python 3 中导入“HdfsClient”包。

4

1 回答 1

2

HDFSClient已弃用。您可能想使用pyarrow.hdfs.connect. 还要尝试pip freeze查看您的python环境中是否安装了相关库。前任。

from pyarrow import hdfs
hdfs.connect('192.168.0.119', 50070, 'cloudera', driver='libhdfs')
于 2019-04-03T07:38:10.257 回答