我正在尝试通过 pyarrows' HdfsClient
/连接到 hadoop 集群hdfs.connect()
。
我注意到 pyarrows 的have_libhdfs3()
函数,它返回 False。
如何获得 pyarrow 所需的 hdfs 支持?我知道 libhdfs3 有一个 conda 命令,但我非常需要通过一些不涉及 conda 之类的“香草”方式使其工作。
如果它很重要,我有兴趣阅读的文件是镶木地板文件。
编辑:
库的创建者hdfs3
制作了一个允许安装 libhdfs3 的仓库: