问题标签 [hypertable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
92 浏览

hadoop - Hypertable 适用于 Hadoop 2.x?

我想知道我是否可以在 Hadoop 2.3.0(或 2.2.0)之上安装 Hypertable。我暂时不想使用 Cloudera,因为我是 Hadoop 新手,现在只想学习一件事。

0 投票
1 回答
110 浏览

hadoop - 在 hadoop 上配置超表运行时,DfsBroker 无法启动错误

我只是尝试在 hadoop 上安装 hypertable 遵循官方文档首先我在 CentOS 6.5-32bit 节点上以 persudo-distribute 模式部署 cdh4

然后按照hypertable官方文档在hadoop上安装hypertable

当我跑步时

获取 DfsBroker 没有出现错误

我检查 /opt/hypertable/0.9.7.16 中的 DfsBroker.hadoop.log 得到这个

但我 JAVA_HOME 已设置,我测试 java 运行正常

我尝试单独运行 jrun ,它没有提示 exec: java : not found

我在谷歌之后看到了类似的问题

但我已经使用了所有我能找到的解决方案

刚刚获得

所以如果有人能给我关于这个问题的提示,我将不胜感激

0 投票
0 回答
50 浏览

database - 一个单元格的超表过滤器,但带来所有列族

我试图做这样的事情:

从 mytable 中选择 column1、column2 where column1 = 'wathever';

但是我找不到与超表类似的东西,我了解架构并且它处理各个行,但我想知道这是否可能,我想按一列过滤但带来所有列族。

提前致谢

0 投票
1 回答
418 浏览

database - 需要用于抓取数据和日志数据的高度压缩数据存储

我必须以有效的压缩率将大量爬网和日志数据存储在 Datastore 中。

到目前为止,我尝试并安装了 Cassandra、Couchbase、Mysql 和 FlatFile 格式,并阅读了Google Big Table、Hypertable 和LevelDB File Layout的架构概述。

Cassandra 和 Couchbase 的磁盘大小约为未压缩 Mysql 数据库的 1/5,但我想要更好的结果。

所以我需要一个具有高压缩特性的简单数据存储,如 vertica、teradata、oracle 和 sqlserver 产品。(页面级压缩)

实际的 flatFile 数据集看起来像

每个文件大约有 400 个高冗余条目,每个大约 5kb 一个文件可以从 1722 KB 压缩到 39 KB,因此根据压缩块的大小,应该可以实现 44:1 到 100:1 的压缩比。

定义用例:

我必须每 30 秒轮询一次所有相关的 gas_station 网页/api 以获得最新的定价信息,因为不可能为每个加油站编写解析器,索引创建需要通用解决方案。使用包含所有 craweld 加油站页面的数据库,可以轻松开发通用解析器并进行回测。使用此原始数据模型,应避免通过损坏的特定转换器丢失数据。

使用“oil_type-gas_station-timestamp-content”之类的键,可以轻松高效地比较两个加油站的价格随时间变化。对于读取小于压缩块大小的时间序列,只需解压缩 2 到 4 个块。

因此,以下功能是最佳的:

  • SSTables
  • 可配置的压缩选项(级别、压缩引擎、块大小(从 64kb 到 10 MB))
  • 范围扫描
  • Java 绑定
  • 列数据存储以实现更好的压缩

很高兴有:

  • 复制
  • 多主
  • 写入法定人数 1
  • 对数据进行前向和后向迭代。(比较两个时间序列)
  • 可配置的副本分布
  • 很少的依赖

问题:

Wich 免费数据库能够保存高冗余爬取数据的归档数据(只有几个字节变化),压缩好并且不会花费太多时间来查询随机记录。(与 mysql 归档格式相反,它必须解压缩整个表,直到请求的行)

也许有一个日志数据库,它能够索引很多日志行并在内部压缩它们?(logstash、fluentd、flume 的范围)

如果有人知道一些基准,关于这个主题的数字,这将有助于评估正确的技术。

我很高兴你的帮助!

0 投票
1 回答
94 浏览

select - 如何在超表中选择行

首先我创建了一个表

最后我在表格中选择所有内容,它将显示如下:

它仅在一行中显示一个值它不能显示表中一行的所有值:(我如何在一行中选择它将显示该行的所有值在这种情况下我添加了 4 行但它显示8线

0 投票
1 回答
87 浏览

hbase - 估计行大小 HBase/HyperTable

如果我知道我将存储什么样的数据(考虑到压缩),有没有办法估计行大小?

我正在看类似的东西

bson_id | 字符串(最多 200 个字符)| 整数32 | 整数32 | 整数32 | 布尔 | 布尔 | 日期时间 | 日期时间 | 日期时间 | 整数32

我正在尝试为大约 2 万亿条记录(如上述记录)以及大约 x20 的记录找到最佳的数据库解决方案

bson_id | bson_id

欢迎任何其他建议

0 投票
1 回答
113 浏览

hbase - Hypertable 生产准备好了吗?

Hypertable 生产准备好了吗?我可以在网上找到很少的信息。似乎每个人都使用 HBase 而不是 Hypertable 声称要快得多。

0 投票
0 回答
257 浏览

hadoop - 在 Windows 10 上的 xampp 上安装 Hypertable 和 thrift

请告诉我是否可以在 windows 10 64bit 上的 xampp 上安装 hypertable 和 thrift 以及 hadoop 来测试站点。如果可能的话,请提供安装这些东西的分步指南。问候

0 投票
0 回答
45 浏览

java - Hypertable 中的示例错误

我有一个 Java 语言的代码,我正在使用 Hypertable 的一个例子,但我有一个错误。

代码是:

输出是

我的问题是什么??

0 投票
1 回答
109 浏览

python - 为超表查询语言实现选择更新

我被要求在 python 的 HQL 中实现 select for update。我没有尝试过任何事情,因为我不知道我将如何去做。由于 select for update 在我们禁用 autocommit 之后获取行,并在那里通过锁定表中的特定行直到我们提交并启用 autocommit ,所以在我看来,在超表中实现有点怀疑。如何在 Hypertable 中锁定几行?

现在我有一张像

我还在开始学习 hypertable 。

一些帮助将不胜感激。