问题标签 [impyla]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 获取详细的 Impyla 错误消息
当我使用 Python/Impala 在 Impala 中执行 SQL 语句时,我只是得到一个带有一般错误消息的异常,如“”Operation is in ERROR_STATE”。如何获得有关所发生错误的更多详细信息?
python-2.7 - 不计算熊猫数据框中所有列的总和
我正在使用从 Impala 中提取数据impyla
,并使用as_pandas
. 我正在使用Pandas 0.18.0
,Python 2.7.9
我正在尝试计算数据框中所有列的总和,并尝试选择大于阈值的列。
self.data = self.data.loc[:,self.data.sum(axis=0) > 15]
但是当我运行它时,我收到如下错误:
pandas.core.indexing.IndexingError:提供了不可对齐的布尔系列键
然后我尝试如下。
print 'length : ',len(self.data.sum(axis = 0)),' all columns : ',len(self.data.columns)
然后我得到不同的长度,即
长度:78 所有列:83
我得到了低于警告
C:\Python27\lib\decimal.py:1150: RuntimeWarning: tp_compare 没有返回 -1 或 -2 的异常
为了实现我的目标,我尝试了另一种方式
现在我得到了其他错误,如下所示:
TypeError:+ 的不支持的操作数类型:'Decimal' 和 'float' C:\Python27\lib\decimal.py:1150: RuntimeWarning: tp_compare 没有返回 -1 或 -2 异常
然后我尝试获取每一列的数据类型,如下所示。
结果所有列都是int64 , object 和 float 64 之一然后我想改变对象中列的数据类型,如下所示
我仍然遇到同样的错误,请帮助我解决这个问题。
注意:在所有列中,我都没有字符串,即字符和缺失值或为空。我已经使用self.data.to_csv
因为我是 pandas 和 python 的新手,所以请不要介意这是一个愚蠢的问题。我只想学习
python - 如何处理“finally”块中的异常?
给定以下 Python 代码:
与 Impala 的连接已创建。cursor.close()
但是由于 Impala 超时而出现异常。
鉴于潜在异常,关闭cursor
and的正确方法是什么?conn
python - 在 Windows 上导入 Impyla 库时出错
我在 Windows 上使用 impyla 库时遇到问题
我安装了 impyla 库
pip install impyla
当我尝试在 python 代码中导入 impyla 库时发生错误
回溯(最近一次通话最后一次):...
文件“D:/test/test.py”,第 14 行, 从 impala.dbapi 导入连接
文件“C:\Anaconda3\lib\site-packages\impala\dbapi.py”,第 28 行,在 import impala.hiveserver2 as hs2
文件“C:\Anaconda3\lib\site-packages\impala\hiveserver2.py”,第 32 行, 从 impala._thrift_api 导入(
文件“C:\Anaconda3\lib\site-packages\impala_thrift_api.py”,第 73 行,在 include_dirs=[thrift_dir])
文件“C:\Anaconda3\lib\site-packages\thriftpy\parser__init__.py”,第 30 行,加载 include_dir=include_dir)
文件“C:\Anaconda3\lib\site-packages\thriftpy\parser\parser.py”,第 496 行,解析 url_scheme))
thriftpy.parser.exc.ThriftParserError:ThriftPy 不支持使用协议“c”中的路径生成模块
当我尝试打印 include_dir 时,它是
D:/test\thrift
我根本无法导入 libray
帮我
python - 通过 sqlalchemy 的 impala 连接
我是hadoop和impala的新手。我通过安装impyla 并执行以下代码设法连接到 impala 。这是通过 LDAP 进行的连接:
然后我可以抓取一个游标并执行查询:
我希望能够使用 sqlalchemy 连接到 impala 并能够使用一些不错的 sqlalchemy 函数。我在 imyla 源代码中找到了一个测试文件,该文件说明了如何使用 impala 驱动程序创建 sqlalchemy 引擎,例如:
我希望能够做到这一点,但我做不到,因为我对上面的连接函数的调用有很多参数;而且我不知道如何将这些传递给 sqlalchemy 的 create_engine 以获得成功的连接。有人做过吗?谢谢。
python - 使用 impyla 将行插入 Hive 表时写入速度极慢
尝试使用impyla
.
这是我在 python 中编写的代码示例:
有趣的是,即使我正在启动一个executemany
命令impyla
,仍然会将其解析为多个 MapReduce 作业。事实上,我可以看到与我传递给impyla.executemany
方法的元组对象的元组中包含的元组一样多的 MapReduce 作业启动。
你看有什么不对吗?一个多小时后给你一个想法,它只写了 350 行。
ldap - 使用 LDAP 连接配置单元时无法启动 SASL
在没有身份验证的情况下连接到配置单元服务器时,它可以正常工作,如下所示:
conn = connect(host='host.without.authenticate.', port=xxx, database=xxx, auth_mechanism='PLAIN')
当使用 ldap 身份验证连接到配置单元服务器时,发生 sasl 错误。
无法启动 SASL:sasl_client_start (-4) SASL(-4) 中的错误
我已经安装了saal
and thrift-sasl
,并且可以通过 shell 登录 hive:
配置:ubuntu 14,python2.7 我已经访问了问题https://github.com/cloudera/impyla/issues/149但没有适用的方法我不知道出了什么问题,感谢您的回答
python - 使用 python 模块 impyla 连接到 Kerberized hadoop 集群
我正在使用 impyla 模块连接到 kerberized hadoop 集群。我想访问
hiveserver2/hive 但我收到以下错误:
test_conn.py
堆栈跟踪:
testuser 是我将用于执行 kinit 的 kerberos 主体。
python - 在 Impyla 中执行 Hive 脚本
我看到的 Impyla 示例是用于执行命令行查询,
即相当于跑步
Impyla 中是否有能够运行类似以下内容的功能:
python - 无法使用 impyla 连接到 Hiveserver2
有人可以帮我解决 Windows 10 上的以下问题吗?
这是我拥有的python代码:
已安装 Python 包的列表:
- 位数组==0.8.1
- impyla==0.14.0
- sasl==0.2.1
- 六==1.10.0
- 节俭==0.9.3
- 节俭-sasl==0.2.1
版本:
- 操作系统版本:Microsoft Windows 10(64 位)
- DBMS 版本:1.2.1.2.3.6.0-3796 Apache Hive
追溯:
按照 python的说明,我能够在 Linux Ubuntu 16.04 上成功运行此代码无法连接 hiveserver2票证。
提前致谢!