问题标签 [happybase]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 仅给出 hbase.zookeeper.quorum 时连接到 HBase
何时hbase-site.xml
给出
如何使用happybase 连接到HBase?
我试图连接到其中之一
这显示以下错误:
python - Spark不能腌制method_descriptor
我收到这个奇怪的错误信息
我的更新函数返回一个类型的元组列表,(key, (value1, value2))
它们都是字符串,如下所示:
编辑: 问题出在这 2 个 hbase 函数上,即 row 和 put。当我评论它们时,两个代码都可以工作(将 old_fi 设置为空字典),但如果其中一个运行,则会产生上述错误。我使用happybase在python中操作hbase。有人可以解释我出了什么问题吗?
python - 在python中使用happybase关闭与hbase数据库的连接
每次我运行这个脚本时,它都会将数据填充到 hbase 表中,但它会打开一个连接。当我检查使用时,netstat -an
我看到连接数增加了,即使在脚本完成后仍然存在。
我错过了什么吗?我们需要明确关闭连接吗?
感谢您的帮助。
python - 从 python (happybase) 写入 hbase 表
我正在运行一个 map-reduce 作业,现在我想将值输入到 hbase 中。我通过标准输入从 map-reduce 作业中流式传输值,并有一个 python 脚本在happybase上插入(放置)行。
我遇到了不同类型的问题,从 python 中执行 put。据我了解,最近的问题似乎与库兼容性问题有关。错误日志显示了迭代项的问题。happybase 手册引用了排序查询所需的其他 python 库,从 python 版本 2.7 开始不需要这些库(我正在运行 2.7.6)。
有没有人遇到过类似的问题?它们是否可以轻松修复,或者您会建议使用不同的界面吗?
更多细节
我安装了 hadoop (2.6.0) 和 hbase (0.98.10 - 2/5/2015) 并在独立配置中运行。它们已启动。我可以通过 shell 与 hbase 交互、创建表、输入值并扫描它们。
我可以通过happybase从python扫描和打印表格,这至少表明连接有效。但是 put 总是失败。这个简短的例子说明了这个问题:
对于这个示例,我的表称为test(在 hbase shell 中创建)。它有一列f1。
现在蟒蛇:
更多细节:
节俭正在运行。
java 版本 "1.8.0_31" Java(TM) SE Runtime Environment (build 1.8.0_31-b13) Java HotSpot(TM) 64-Bit Server VM (build 25.31-b07, 混合模式)
错误日志:
hbase - happybase table.put 不接受任何字符串值吗?
我一直在使用 java 和 python 测试 table.put。
在 java 中,您可以将 int 或 float 值写入列中。使用快乐基地
它用 TypeError 炸毁:“int”类型的对象没有 len()
除了字符串之外,happybase 不支持写出任何内容,这可能是真的吗?
python - 使用happybase只获取一行的前10列
是否可以从一行中仅获取有限数量的列族?假设我只想获取['cf1': 'col1']
特定行的前 10 个值。
python - 使用happybase 输出分隔的HBase 列
我有这样的 HBase 表:
url1, url2, ...
是行键。该表只有一个列族。
我有一个日期范围(从datei
到datej
)作为输入。我需要在一天内为每个 url 输出点击份额。
输出必须具有以下格式:
在哪里
我开始编写happybase-script,但我不知道如何使用happybase 从行中选择单独的列。我的happybase脚本如下:
那么,我应该如何更改我的脚本(实际上是query()
函数)以在定义的日期范围内获取分隔列?
python - HBase 的 HappyBase 和原子批量插入
使用 Python 中 HBase 的 HappyBase API,可以通过以下方式执行批量插入:
如果这批中途失败会发生什么?已经保存的行会保持保存而那些没有保存吗?
我在 HappyBase github 中注意到该table.batch()
方法采用transaction
和wal
作为参数。是否可以将这些配置为在批处理中途失败的情况下回滚成功保存的行?
happybase 会在这里抛出异常,这将允许我记下行键并执行批量删除吗?
python - happybase table.scan() 和 hbase thriftscannerGetList() 之间的区别
我有两个版本的 python 脚本,可以在 while 循环中按 1000 行扫描 hbase 中的表。第一个使用happybase,如https://happybase.readthedocs.org/en/latest/user.html#retrieving-rows
第二个使用 hbase 节俭接口,如http://blog.cloudera.com/blog/2014/04/how-to-use-the-hbase-thrift-interface-part-3-using-scans/
数据库中的行是数字。所以我的问题是在某些行发生了一些奇怪的事情:
happybase 打印(行):
和 thrift_scanner 打印(行):
这不是发生在接下来的 1000 行(row_start=new_scan 或 next data=scannerGetList),而是在批处理的中间。而且每次都会发生。
我会说带有scannerGetList 的第二个脚本做得对。
为什么happybase 做的不一样?是否考虑时间戳或happybase / hbase逻辑中的其他一些?它最终会以不同的顺序扫描整个表吗?
附言。我知道happybase 版本将扫描并打印第1000 行两次,scannerGetList 将忽略下一个数据中的第一行。这不是重点,神奇的事情发生在 1000 行批次的中间。
python - happybase 连接 hbase 获取表信息失败
我是 hbase 新手,想按照这里的教程使用 happybase:https ://happybase.readthedocs.org/en/latest/user.html#establishing-a-connection 代码如下:
但我总是遇到节俭问题:
任何人都知道如何解决这个问题?我在linux上。谢谢