问题标签 [hbase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
3654 浏览

database - 任何可扩展的 OLAP 数据库(Web 应用程序规模)?

我有一个应用程序需要对不同级别的聚合进行分析,这就是 OLAP 工作负载。我也想经常更新我的数据库。

例如,这是我的更新的样子(模式看起来像:时间、目标、源 ip、浏览器 -> 访问)

然后我想问一下上个月从 Firefox 浏览器访问 www.stackoverflow.com 的总次数是多少。

我了解 Vertica 系统可以以相对便宜的方式做到这一点(性能和可扩展性方面,但可能不是成本方面)。我在这里有两个问题。

1) 有没有我可以构建的开源产品来解决这个问题?特别是,蒙德里安系统的工作情况如何?(可扩展性和性能) 2)是否有 HBase 或 Hypertable 基础解决方案(显然,裸 HBase/Hypertable 无法做到这一点)?-- 但是如果有一个基于 HBase/Hypertable 的项目,可扩展性可能不会成为 IMO 的问题)?

谢谢!

0 投票
1 回答
3838 浏览

php - 如何使用 PHP Stargate 客户端将数据插入 Hbase 表

我正在安装 HBase 集群,并尝试通过 Stargate REST 接口访问数据。大多数只读功能(即列出表格、获取版本、元数据等)都运行良好。但是,我无法将数据实际插入到我创建的任何表中。这是我到目前为止所得到的......

创建了一个包含两列的虚拟表,如下所示:

表创建工作正常。接下来,我想在我的新表中插入一些数据。这是我尝试这样做的方法:

此请求的结果返回 503 错误,但有以下异常:

错误很明显,但我不确定上面发布的架构有什么问题。

我还想知道我是否最好使用 Thrift 包并生成必要的 PHP 客户端文件而不是使用 Starbase?如果有人对此有任何经验,我很乐意听取您的意见。

任何帮助是极大的赞赏。

0 投票
1 回答
2133 浏览

hbase - 我在运行 hbase 客户端时遇到了这个异常

0 投票
2 回答
410 浏览

hadoop - 这种架构在 Hadoop MR 中是否可行?

Hadoop MapReduce 中是否可以使用以下架构?

使用分布式键值存储(HBase)。因此,除了值之外,还会有一个与值相关联的时间戳。Map & Reduce 任务是迭代执行的。Map,在每次迭代中都应该接受在上一次迭代中添加到存储中的值(也许是具有最新时间戳的那些?)。Reduce 应该接收 Map 的输出以及来自 store 中其键与 reduce 必须在当前迭代中处理的键匹配的对。reduce 的输出到 store。

如果可能,哪些类(例如:InputFormat、Reduce 的 run())应该被扩展,以便代替常规操作发生上述操作。如果这是不可能的,是否有任何替代方法可以实现相同的目标?

0 投票
3 回答
7677 浏览

c# - 在 C# 中使用 Hbase

如何在 C#/VB.NET 中使用 Hbase 数据库?(使用=连接、查询、获取结果、插入、更新、删除)

我在谷歌上找不到有用的答案。

0 投票
3 回答
30370 浏览

java - 如何从 Hbase 读取数据?

您好,我习惯使用 SQL,但我需要从 HBase 表中读取数据。对此的任何帮助都会很棒。一本书或者只是一些从表格中读取的示例代码。有人说使用扫描仪可以解决问题,但我不知道如何使用它。

0 投票
2 回答
1279 浏览

couchdb - 面向文档的 DB 和 Bigtable 克隆之间的区别

有人可以对它们进行正面比较吗?

我们正在为我们的博客历史数据寻找合适的存储引擎。我们看了 Bigtable 的论文,明白它很适合我们。

然而,我也明白,像 MongoDB 这样的面向文档的 DB 似乎提供了更强大的模式能力——即,它也可以对我们的数据进行建模。

我想知道现在人们如何选择可扩展的 NoSQL DB --- 我读了足够多的文章,例如“我们研究了 A、B 和 C,我们决定使用 C”。但我想看看一些基准数字。我的意思是,如果 MongoDB 等可以提供与 Bigtable 克隆相同水平的性能,那么网络公司为什么不选择它(准备处理各种可能更复杂的数据问题)?

谢谢,

顺便说一句,我读了一篇文章(当时让我信服)说 Cassandra 不适合 M/R 操作,有什么意见吗?

0 投票
3 回答
7400 浏览

hadoop - 如何使用 Map/Reduce 选择随机(小)数据样本?

我想编写一个 map/reduce 作业,以根据行级条件从大型数据集中选择多个随机样本。我想尽量减少中间键的数量。

伪代码:

你做过这样的事情吗?有没有众所周知的算法?

包含连续行的样本也足够好。

谢谢。

0 投票
3 回答
2072 浏览

olap - Hbase 架构设计——让排序变得容易?

我的字典里有 100 万个单词。每当用户在我的网站上发出查询时,我都会查看查询是否包含我的字典中的单词,并分别增加与它们对应的计数器。下面是一个例子,假设用户输入“奥巴马是总统”并且“奥巴马”和“总统”在我的字典中,那么我应该将“奥巴马”和“总统”的计数器加 1。

有时,我想查看前 100 个单词(查询最多的单词)。如果我使用 Hbase 来存储计数器,我应该使用什么模式?- 我还没有想出一个有效的。

如果我将字典中的单词用作行键,将“计数器”用作列键,那么更新计数器(增量)非常有效。但是很难排序并返回前 100 名。

任何人都可以给一个好的建议吗?谢谢。

0 投票
4 回答
1077 浏览

sql - Cassandra/HBase 或只是 MySQL:做下一件事的潜在问题

说我有“用户”。这是关键。我需要保持“用户数”。我计划记录关键的“用户”和值“0”到“9999+ ;-)”(尽可能多)。

如果我为此使用 Cassandra、HBase 或 MySQL,我会遇到什么问题?比如说,我对这个“用户”键有数千个新更新,我需要在其中增加值。我有麻烦了吗?锁定写入?还有其他方法吗?

为什么这样做——会有很多类似“用户”的键。其他情况不同。但想法是一样的。为什么要保持这种方式——因为我会有更多的读取,所以我总是可以非常快地获得“计数值”。