0

我正在尝试从 Kudu 检索数据。但我无法在 anaconda 或我的服务器中安装 kudu-python 包。我能得到一些帮助吗?互联网上的文档不是很清楚。

4

2 回答 2

3

@Karthik,您遇到任何错误吗?我刚刚在 Centos 6.9 上的 Anaconda 上安装了 kudu-python 客户端。版本控制有一个问题,但除此之外它很简单。我遇到的唯一错误是

kudu/client.cpp:589:30: fatal error: kudu/util/int128.h: No such file or directory

这里有一个解决方案:https ://community.cloudera.com/t5/Data-Ingestion-Integration/can-not-install-kudu-python/td-p/67496

否则,步骤如下: 1. 按照 Kudu 网站 ( https://kudu.apache.org/docs/installation.html#_install_on_rhel_or_centos_hosts )中的说明安装 kudu 客户端库:

wget http://archive.cloudera.com/kudu/redhat/6/x86_64/kudu/cloudera-kudu.repo
sudo mv cloudera-kudu.repo /etc/yum.repos.d/
sudo yum update
sudo yum install kudu kudu-client0 kudu-client-devel
  1. 如果您还没有它们,请安装一堆开发依赖项:

    sudo yum install autoconf automake libtool make gcc gcc-c++

  2. 安装 Cython 和 kudu-python

    pip install Cython kudu-python==1.2.0

安装后,您可以在https://github.com/apache/kudu/tree/master/examples/python中找到示例

于 2018-10-12T21:39:30.753 回答
1

我无法安装 kudu-client(不支持 windows os),所以我使用集群的Impala来获取 Kudu 的表:

from impala.dbapi import connect
conn = connect('<Impala Daemon>', port=21050) 
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
print(cursor.description)  # prints the result set's schema
results = cursor.fetchall()

https://github.com/cloudera/impyla

于 2019-11-06T09:19:34.933 回答