问题标签 [happybase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
121 浏览

python - AWS EMR 上的 HBase 检索数据缓慢

我正在运行一个安装了 HBase 的 AWS EMR 集群,我按照这些说明使用 s3 作为 Hbase 数据存储来设置集群。集群已启动并正在运行,我可以毫无问题地 ssh 并使用它hbase shell

我们试图存储的数据是基因组数据,而且非常广泛。对于每个行键,最多可以有 250,000 个列键。我们尝试了不同数量的列族,从将所有键分组到一个列族中,到使用 42 个不同的列族,列键分布在它们之间。

为了与 Hbase 交互,我们happybase在 python 中使用,它用于thrift与主节点进行通信。检索单个行键时,返回结果大约需要 2.7 秒。我期待这种类型的操作需要毫秒的数据检索时间。取回时。我们的配置非常简单,没有进行额外的优化。我们正在尝试确定 Hbase 是否是满足我们数据库需求的正确应用程序,但鉴于数据检索时间缓慢,我们正在远离它。

在此处输入图像描述

在此处输入图像描述

我知道其他大型行业参与者使用 HBase 来满足他们的需求,并且想知道是否有人知道我们可以尝试哪些事情来优化性能?虽然这些时间并不可怕,但应用程序最终将需要放置数千个行键并检索所有列的数千个行键。鉴于我们迄今为止看到的扩展,这将无法满足我们的需求。

我对 HBase 等分布式 NoSQL 技术的经验很少,因此我将不胜感激任何建议或帮助。

集群设置:

我们尝试过的事情:

  1. 调整列族数
  2. 使用 HDFS 而不是 s3 作为数据存储
0 投票
1 回答
35 浏览

hbase - Google Colab 上的 HBase、HappyBase - 读取作品,插入失败

我已经在 Google Colab 中安装了 Hadoop、Hbase 并尝试创建表,然后在那里读取并插入记录。
HBase shell 命令正在工作并使用它我创建了一个名为“cars2”的小表,并且可以在那里读取数据。

但是我想从 Python 访问 HBase 并安装了 HappyBase

然后我尝试访问数据

到目前为止,一切都很好。问题从下一个命令开始,给出错误

我应该如何解决这个错误?
但有时我在同一个命令上得到一个不同的错误

将非常感谢有关如何解决此问题的一些建议。实际的笔记本可以在这里找到

0 投票
0 回答
22 浏览

python - happybase 无法检索 hbase 信息

我正在使用 python happybase 连接到 hbase,但未能检索到 hbase 信息。我的代码如下:

错误:

有谁知道问题是什么以及如何解决这个问题?

0 投票
0 回答
12 浏览

python - happybase 扫描一张表

我有一个数据库,其中包含一个名为 transactions 的表,并且该表具有以下列:

注册:活跃
交易:活跃

我想在所有表中执行扫描并仅返回注册:活动和事务:活动为 = true 的行。

我试过table.scan了,但它不能正常工作。

你们有什么想法吗?