“impyla”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

978 浏览

python - 获取详细的 Impyla 错误消息

当我使用 Python/Impala 在 Impala 中执行 SQL 语句时，我只是得到一个带有一般错误消息的异常，如“”Operation is in ERROR_STATE”。如何获得有关所发生错误的更多详细信息？

2016-04-21T05:16:41.097

0 投票

1 回答

1535 浏览

python-2.7 - 不计算熊猫数据框中所有列的总和

我正在使用从 Impala 中提取数据impyla，并使用as_pandas. 我正在使用Pandas 0.18.0，Python 2.7.9

我正在尝试计算数据框中所有列的总和，并尝试选择大于阈值的列。

self.data = self.data.loc[:,self.data.sum(axis=0) > 15]

但是当我运行它时，我收到如下错误：

pandas.core.indexing.IndexingError：提供了不可对齐的布尔系列键

然后我尝试如下。

print 'length : ',len(self.data.sum(axis = 0)),' all columns : ',len(self.data.columns)

然后我得到不同的长度，即

长度：78 所有列：83

我得到了低于警告

C:\Python27\lib\decimal.py:1150: RuntimeWarning: tp_compare 没有返回 -1 或 -2 的异常

为了实现我的目标，我尝试了另一种方式

现在我得到了其他错误，如下所示：

TypeError：+ 的不支持的操作数类型：'Decimal' 和 'float' C:\Python27\lib\decimal.py:1150: RuntimeWarning: tp_compare 没有返回 -1 或 -2 异常

然后我尝试获取每一列的数据类型，如下所示。

结果所有列都是int64 ， object 和 float 64 之一然后我想改变对象中列的数据类型，如下所示

我仍然遇到同样的错误，请帮助我解决这个问题。

注意：在所有列中，我都没有字符串，即字符和缺失值或为空。我已经使用self.data.to_csv

因为我是 pandas 和 python 的新手，所以请不要介意这是一个愚蠢的问题。我只想学习

python-2.7 pandas impyla

2016-05-06T11:44:01.723

0 投票

1 回答

780 浏览

python - 如何处理“finally”块中的异常？

给定以下 Python 代码：

与 Impala 的连接已创建。cursor.close()但是由于 Impala 超时而出现异常。

鉴于潜在异常，关闭cursorand的正确方法是什么？conn

python impala impyla

2016-05-23T05:54:31.300

0 投票

2 回答

5788 浏览

python - 在 Windows 上导入 Impyla 库时出错

我在 Windows 上使用 impyla 库时遇到问题

我安装了 impyla 库

pip install impyla

当我尝试在 python 代码中导入 impyla 库时发生错误

回溯（最近一次通话最后一次）：...

文件“D:/test/test.py”，第 14 行， 从 impala.dbapi 导入连接

文件“C:\Anaconda3\lib\site-packages\impala\dbapi.py”，第 28 行，在 import impala.hiveserver2 as hs2

文件“C:\Anaconda3\lib\site-packages\impala\hiveserver2.py”，第 32 行， 从 impala._thrift_api 导入（

文件“C:\Anaconda3\lib\site-packages\impala_thrift_api.py”，第 73 行，在 include_dirs=[thrift_dir]）

文件“C:\Anaconda3\lib\site-packages\thriftpy\parser__init__.py”，第 30 行，加载 include_dir=include_dir)

文件“C:\Anaconda3\lib\site-packages\thriftpy\parser\parser.py”，第 496 行，解析 url_scheme))

thriftpy.parser.exc.ThriftParserError：ThriftPy 不支持使用协议“c”中的路径生成模块

当我尝试打印 include_dir 时，它是

D:/test\thrift

我根本无法导入 libray

帮我

python windows impyla

2016-08-30T06:18:56.900

0 投票

3 回答

8584 浏览

python - 通过 sqlalchemy 的 impala 连接

我是hadoop和impala的新手。我通过安装impyla 并执行以下代码设法连接到 impala 。这是通过 LDAP 进行的连接：

然后我可以抓取一个游标并执行查询：

我希望能够使用 sqlalchemy 连接到 impala 并能够使用一些不错的 sqlalchemy 函数。我在 imyla 源代码中找到了一个测试文件，该文件说明了如何使用 impala 驱动程序创建 sqlalchemy 引擎，例如：

我希望能够做到这一点，但我做不到，因为我对上面的连接函数的调用有很多参数；而且我不知道如何将这些传递给 sqlalchemy 的 create_engine 以获得成功的连接。有人做过吗？谢谢。

python python-3.x sqlalchemy flask-sqlalchemy impyla

2016-09-19T22:07:36.750

0 投票

0 回答

1842 浏览

python - 使用 impyla 将行插入 Hive 表时写入速度极慢

尝试使用impyla.

这是我在 python 中编写的代码示例：

有趣的是，即使我正在启动一个executemany命令impyla，仍然会将其解析为多个 MapReduce 作业。事实上，我可以看到与我传递给impyla.executemany方法的元组对象的元组中包含的元组一样多的 MapReduce 作业启动。

你看有什么不对吗？一个多小时后给你一个想法，它只写了 350 行。

python hadoop hive impala impyla

2016-09-22T15:23:54.930

0 投票

0 回答

482 浏览

ldap - 使用 LDAP 连接配置单元时无法启动 SASL

在没有身份验证的情况下连接到配置单元服务器时，它可以正常工作，如下所示：

conn = connect(host='host.without.authenticate.', port=xxx, database=xxx, auth_mechanism='PLAIN')
当使用 ldap 身份验证连接到配置单元服务器时，发生 sasl 错误。

无法启动 SASL：sasl_client_start (-4) SASL(-4) 中的错误

我已经安装了saaland thrift-sasl，并且可以通过 shell 登录 hive：

配置：ubuntu 14，python2.7 我已经访问了问题https://github.com/cloudera/impyla/issues/149但没有适用的方法我不知道出了什么问题，感谢您的回答

ldap sasl impyla

2016-12-05T07:19:30.923

0 投票

1 回答

1310 浏览

python - 使用 python 模块 impyla 连接到 Kerberized hadoop 集群

我正在使用 impyla 模块连接到 kerberized hadoop 集群。我想访问
hiveserver2/hive 但我收到以下错误：

test_conn.py

堆栈跟踪：

testuser 是我将用于执行 kinit 的 kerberos 主体。

python python-2.7 hadoop kerberos impyla

2017-01-19T09:47:29.850

0 投票

1 回答

197 浏览

python - 在 Impyla 中执行 Hive 脚本

我看到的 Impyla 示例是用于执行命令行查询，

即相当于跑步

Impyla 中是否有能够运行类似以下内容的功能：

python hive impyla

2017-02-17T21:37:22.143

0 投票

0 回答

1110 浏览

python - 无法使用 impyla 连接到 Hiveserver2

有人可以帮我解决 Windows 10 上的以下问题吗？

这是我拥有的python代码：

已安装 Python 包的列表：

位数组==0.8.1
impyla==0.14.0
sasl==0.2.1
六==1.10.0
节俭==0.9.3
节俭-sasl==0.2.1

版本：

操作系统版本：Microsoft Windows 10（64 位）
DBMS 版本：1.2.1.2.3.6.0-3796 Apache Hive

追溯：

按照 python的说明，我能够在 Linux Ubuntu 16.04 上成功运行此代码无法连接 hiveserver2票证。

提前致谢！

python hive impyla

2017-03-22T15:55:07.540

问题标签 [impyla]

test_conn.py

Reference