问题标签 [hbase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
43982 浏览

hadoop - Hive 与 HBase 相比如何?

我有兴趣了解最近发布的 ( http://mirror.facebook.com/facebook/hive/hadoop-0.17/ ) Hive 在性能方面与 HBase 的比较。Hive 使用的类 SQL 接口比我们实现的 HBase API 更可取。

0 投票
6 回答
19479 浏览

hadoop - Hbase / Hadoop 查询帮助

我正在和一个朋友一起做一个项目,该项目将利用 Hbase 来存储它的数据。有没有好的查询示例?我似乎正在编写大量 Java 代码来遍历 RowResult 的列表,而在 SQL 领域,我可以编写一个简单的查询。我错过了什么吗?还是 Hbase 缺少什么?

0 投票
5 回答
1589 浏览

ruby-on-rails - Ruby On Rails/Merb 作为数十亿记录应用程序的前端

我正在为用 Ruby on Rails 或 Merb 编写的应用程序寻找后端解决方案,以处理具有数十亿条记录的数据。我有一种感觉,我应该使用分布式模型,而此刻我看着

HBaseHadoop

沙发数据库

在我看来,HBase 解决方案存在问题——对 ruby​​ 的支持不是很强,而且 Couchdb 还没有达到 1.0 版本。

对于如此大量的数据,您有什么建议吗?

数据有时需要一次相当快的导入 30-40Mb,但导入将分批进行。因此,大约 95% 的时间数据将是只读的。

0 投票
2 回答
8934 浏览

rdbms - 如何设计 Hbase 架构?

假设我有这个 RDBM 表(Entity-attribute-value_model):

由于缩放问题,我想使用 HBase。

我知道访问 Hbase 表的唯一方法是使用主键(光标)。您可以获得特定键的游标,并逐个迭代行。

问题是,就我而言,我希望能够迭代所有 3 列。例如 :

  • 对于给定的 entityID,我想获取它的所有属性和值
  • 对于给定的属性名称和值,我想要所有的 entitiIDS ...

所以我的一个想法是构建一个 Hbase 表来保存数据(表 DATA,以 entityID 作为主索引),以及 2 个“索引”表,一个以 attributeName 作为主键,另一个以 value

每个索引表都将保存 DATA 表的指针(实体 ID)列表。

这是一个合理的方法吗?或者是 Hbase 概念的“滥用”?

在这篇博客中,作者说:

HBase 允许通过主键获取操作并在行范围内扫描(想想:游标)。(如果你有二级索引的规模和需要,别担心 - Lucene 来拯救!但那是另一篇文章。)

您知道 Lucene 如何提供帮助吗?

——约纳坦

0 投票
2 回答
6308 浏览

database-design - Hadoop Hbase:是否跨表传播列族

Hbase 文档清楚地表明您应该将类​​似的列分组到列族中,因为物理存储是由列族完成的。

但是,将两个列族放入同一个表中,而不是每个列组有单独的表,这意味着什么?是否存在以这种方式“分区”表更有意义的特定情况,以及一个“宽”表效果更好的情况?

单独的表应该导致单独的“行区域”,当某些列族(作为一个整体)非常稀疏时,这可能是有益的。相反,什么时候将列族聚集在一起是有利的?

0 投票
2 回答
4078 浏览

php - 使用 Thrift 在 HBase 中写入 php 数组

我有一个 Thrift php 客户端,我想在 HBase 表中写入,我正在执行以下操作:

问题是在 HBase 中插入时,作为数组的值被转换为“数组”,而不是存储数组的元素。如何将列表存储为数组(或字节数组)

0 投票
1 回答
2460 浏览

hadoop - HBase 是否稳定且可用于生产?

对于已经在自己的集群上部署 HBase 的人,您是否觉得它对于生产使用足够稳定?您遇到了哪些类型的麻烦或问题?

我确实看到很多公司在生产中使用 HBase ( http://wiki.apache.org/hadoop/Hbase/PoweredBy ),但我很好奇是否需要进行大量维护、修补和防火练习保持 HBase 集群正常运行。

0 投票
2 回答
1590 浏览

hadoop - HBase 分布式扫描器

在 HBase 文档的“入门”页面上的“API 使用示例”中,有一个扫描仪使用示例:

扫描仪扫描仪 = table.getScanner(new String[]{"myColumnFamily:columnQualifier1"});

}

据我了解,此代码将在一台机器(名称节点)上执行,并且不会分发所有扫描和过滤工作。仅分发数据存储和数据加载。如何使用分布式扫描仪,它将在每个节点上单独工作。

快速数据过滤的最佳实践是什么?谢谢。

0 投票
3 回答
776 浏览

store - 列存储数据库上的二级索引

是否有任何支持二级索引的列存储数据库?我知道 HBase 可以,但还没有。

哈盖。

0 投票
2 回答
6550 浏览

ruby-on-rails - 编写 ActiveRecord 适配器

我想为HBase 数据库编写自己的ActiveRecord 适配器,因为目前不存在。但是,我在网上搜索了一段时间,找不到任何关于如何编写 ActiveRecord 适配器的好资源。你会怎么做,或者你有什么可以推荐的链接?