问题标签 [hypertable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1624 浏览

memory - MongoDB、Riak 和 HyperTable(或 HBase)的内存需求/利用率

我已经评估了大多数 NoSQL 解决方案,似乎结合使用 MongoDB、Riak 和 HyperTable(或 HBase)是可行的方法。

这些数据库舒适运行的最低要求是什么?

比方说,如果我将这些数据库(MongoDB、Riak 和 HyperTable - 或 HBase)和 Web 服务器(如 nginx 或 Cherokee)和 Java/GlassFish - 全部部署在运行 FreeBSD 且具有 32 GB RAM 的单机上,如何他们表演?请注意,通过这种方法,整个 32 GB RAM 由所有应用程序平均共享。对于 Java/GlassFish 和 HBase,可以使用“-Xmx0000m”选项来限制它,但是对于那些数据库,它们会自动使用整个内存吗?我知道 MongoDB 是内存映射的——等等——那么当它们都在争夺内存时会发生什么?(我认为可以通过启动参数来限制 MongoDB、Riak 和 HyperTable 的内存利用率,但是如何?)

或者,在 Solaris(或 OpenIndiana)上部署 Solaris 容器(或“区域”)虚拟化来限制每个应用程序是否是一种更好的方法,例如为每个 MongoDB、Riak 和 HyperTable/HBase 区域分配 4 GB?在这种方法中,所有数据库基本上都在仅 4 GB 的环境中运行?那么,为了让它们正常工作,最低舒适的 RAM 是多少?

0 投票
0 回答
436 浏览

python - 如何使用 Hadoop Python 在超表中插入“n”值?

如何使用 Hadoop Python 流在超表中插入多个值?我可以为单列插入值,但不能超过一列。在我尝试时,出现以下异常:

地图.py

减少.py

输入表单超表将是制表符分隔值,例如:“这是文本”。

输出表包含三列,我需要按制表符拆分输入文本并将其保存到超表中。Hypertable 输出列名cc, kwoc.

0 投票
2 回答
704 浏览

mysql - Optimal Mysql Config (Partiontion) & Indexes / Hypertable / RAID Config (Huge Database)

tl;rd:

  1. 使用主键进行数据库分区
  2. 索引大小问题。
  3. 数据库大小每天增长约 1-3 GB
  4. 突袭设置。
  5. 你有使用 Hypertable 的经验吗?

长版:

我刚建/买了一个家庭服务器:

  • 至强 E3-1245 3,4 HT
  • 32GB 内存
  • 6x 1.5 TB WD Cavier Black 7200

我将使用服务器主板 INTEL S1200BTL Raid(没有钱购买 RAID 控制器)。http://ark.intel.com/products/53557/Intel-Server-Board-S1200BTL

主板有 4x SATA 3GB/s 接口和 2x SATA 6GB/s

我还不确定我是否可以在 RAID 10 中设置所有 6 个硬盘,

如果不可能,我认为 4x hdds Raid 10 (MYSQL DB) & 2xhdds Raid 0 for (OS/Mysql Indexes)。

(如果raid 0中断,对我来说没问题,我只需要保护数据库)

关于数据库:

它是一个网络爬虫数据库,其中存储了域、url、链接和此类内容。所以我想我用每个表的主键对数据库进行分区,比如 (1-1000000) (1000001-2000000) 等等。

当我在数据库中搜索/插入/选择查询时,我需要扫描孔表,因为有些东西可能在第 1 行,而另一些在第 1000000000000 行。

如果我通过主键(auto_increment)进行这样的分区,这会使用我所有的 CPU 内核吗?以便它并行扫描每个分区?或者我应该坚持使用一个没有分区的巨大数据库。

数据库将非常大,现在在我的家庭系统上,

我看到我可以修复外部链接和链接索引,我只是添加了外部链接,因为我需要查询该字段并且我无法使用链接索引。你看到了吗,我可以在索引上调整什么?我的新系统将有 32 GB,但如果数据库以这种速度增长,我将在 FEW 周/月内使用 90% 的 RAM。

打包的索引有帮助吗?(性能如何下降?)

其他重要表小于 500MB。

当我提取了我需要的所有内容后,可以从此表中擦除数据。

你有使用Hypertables的经验吗?http://hypertable.org/ <= Google 的 Bigtables。如果我转向 Hypertables,这对我的性能有帮助吗(提取数据/搜索/插入/选择和数据库大小)。我在页面上阅读,但我仍然有些无能为力。因为你不能直接比较 MYSQL 和 Hypertables。我会尽快尝试,必须先阅读文档。

我需要一个适合我的设置的解决方案,因为我没有钱用于任何其他硬件设置。

感谢帮助。

0 投票
1 回答
636 浏览

nosql - where 子句中的超表列名

我有两列的应用程序,即。城市,类别。我想把它放在超表中。

还有一个我想添加为 ROW 的 id。

我的问题是如何获取 city = mumbai 的行,这应该获取 2 行 ROW = 1。

所以假设我会在 MySQL 中进行类似的查询..

我将得到 1 行,其中 category=cars、city=mumbai 和 id=1..如何在超表查询中实现相同的目标?

谢谢。

0 投票
1 回答
298 浏览

ubuntu - 云专家的问题 - OpenStack Hypertable?

只是想把我的大脑包裹在开源云上。

1) OpenStack 是在像 Ubuntu 这样的操作系统上运行,还是 Ubuntu 在 OpenStack 上运行?

2) 运行 OpenStack - 你是否得到了 Hypertable(BigTable 开源)之类的东西?

3) 这个 OpenStack 是如何托管的——它是托管 OpenStack 的某种数据中心类型的公司吗?

提前致谢

0 投票
1 回答
371 浏览

user-interface - HyperTable 命名空间的任何可视化工具?

是否有任何可用于超表命名空间的可视化工具?来自用于查看表数据和条目的 RDBMS 世界,是否有任何众所周知的工具可以提供键空间的“类似表”视图?基于 GUI 会很棒!

0 投票
1 回答
733 浏览

select - HyperTable - 为什么我们不能在选择子句中使用 *?

好的,我在通过HyperTable 时遇到了一些麻烦浏览 文档和其他东西我仍然不太确定为什么我不能使用

我只被允许做

如果我想使用行键选择两列怎么办?这是否意味着我不会被允许?还是我没有理解重要的事情?在我看来像后者。

在 Windows 上使用 Hypertable

hypertable> select Col_Id1,Col_Id2 from test where Col_Id2 ="131600";

我得到以下

错误:Hypertable::Exception: 列谓词名称与所选列不同 - Hypertable::Hql::scan_set_column_predicate_name::operator () 处的 HYPERTABLE HQL 解析错误 (c:\soft dev\devel\hypertable\ht4w\src\cc\ hypertable\lib\HqlParser.h:825) - HYPERTABLE HQ L 解析错误

这作为文档状态起作用。

任何帮助和指导表示赞赏。

谢谢。

瓦吉

0 投票
3 回答
1028 浏览

c# - 用于处理 HyperTable 的 C# 库

我正在寻找允许我连接到 Hypertable DB 的连接器/库。我已经在我的 Windows 机器上安装了 Hypertable,但我不知道如何连接到它。我在 Visual Studio 中使用 ASP.NET 4.5 C#。

我试过这个: http ://ht4n.softdev.ch/index.php/getting-started-in-5min

但我不知道如何使用它。将 ht4d.dll 导入到“bin”文件夹,但不知道我还能做什么。

谢谢。

0 投票
2 回答
194 浏览

python - 巨大列表或字典中的 for 循环性能

我正在做一个关于搜索引擎的研究项目,我遇到了 for 循环的性能问题。我有以下问题:

使用超表我希望获得最佳性能,但是当我在 hash_array.keys() 的 20.000 或 30.000 个元素上使用它时,我会得到 5-6 分钟的结果,所以速度非常慢。还有其他方法可以快速执行吗?或者我应该将我的计划 b 用于整个搜索引擎。

查询的性能:

在硬件上测试:

附加事实:

使用解决方案(来自答案)我有以下内容:

这很好,但不是最好的解决方案。

0 投票
1 回答
751 浏览

hbase - 如何在超表中设计用户表

我想在超表数据库中设计一个包含以下字段的用户表:

现在rowkey是用户的id,我引用这个id很多属于用户的东西(我知道在hypertable中唯一的自动主键选项是guid)我不会使用用户名作为rowkey的原因是因为如果发生更改,可以更改用户名,我将不得不更新整个数据库中的很多东西。同样的角色也附加到电子邮件字段。

现在用户可以使用他的用户名或他的电子邮件登录。所以我需要通过电子邮件或用户名检索整行。

你能帮我设计这张桌子吗谢谢。