我正在尝试从 Kudu 检索数据。但我无法在 anaconda 或我的服务器中安装 kudu-python 包。我能得到一些帮助吗?互联网上的文档不是很清楚。
2 回答
@Karthik,您遇到任何错误吗?我刚刚在 Centos 6.9 上的 Anaconda 上安装了 kudu-python 客户端。版本控制有一个问题,但除此之外它很简单。我遇到的唯一错误是
kudu/client.cpp:589:30: fatal error: kudu/util/int128.h: No such file or directory
这里有一个解决方案:https ://community.cloudera.com/t5/Data-Ingestion-Integration/can-not-install-kudu-python/td-p/67496
否则,步骤如下: 1. 按照 Kudu 网站 ( https://kudu.apache.org/docs/installation.html#_install_on_rhel_or_centos_hosts )中的说明安装 kudu 客户端库:
wget http://archive.cloudera.com/kudu/redhat/6/x86_64/kudu/cloudera-kudu.repo
sudo mv cloudera-kudu.repo /etc/yum.repos.d/
sudo yum update
sudo yum install kudu kudu-client0 kudu-client-devel
如果您还没有它们,请安装一堆开发依赖项:
sudo yum install autoconf automake libtool make gcc gcc-c++
安装 Cython 和 kudu-python
pip install Cython kudu-python==1.2.0
安装后,您可以在https://github.com/apache/kudu/tree/master/examples/python中找到示例
我无法安装 kudu-client(不支持 windows os),所以我使用集群的Impala来获取 Kudu 的表:
from impala.dbapi import connect
conn = connect('<Impala Daemon>', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
print(cursor.description) # prints the result set's schema
results = cursor.fetchall()