3

有什么方法可以在我的公司服务器上托管大型查询软件?该公司不希望数据位于自己的数据中心以外的任何其他地方。

什么是 BigQuery 替代品?(云以及托管)

4

2 回答 2

6

有什么方法可以在我的公司服务器上托管大型查询软件?

Google Big QueryGoogle Dremel Paper的实现,但作为服务提供,不能作为软件安装在本地。

什么是大查询替代方案?(云以及托管)

Apache Drill是上述 Dremel 的一个实现,但刚刚开始,可能需要一些时间才能实现。

Cloudera 最近宣布了 Imapala 用于 Hadoop 上的实时查询。查看博客了解更多详情。

有兴趣了解大数据实时查询的其他一些替代方案。

编辑:这是来自InfoWorld的一篇有趣的文章。

于 2012-10-29T14:54:57.227 回答
1

Hive 和 Pig 是制作可查询系统的两种常见解决方案,但由于您提到了 Google 的 Big Query,我假设您的意思是实时查询。

除了 Praveen 提到的实时解决方案之外,还有一些变通方法可以通过以标准化方式编写冗余存储来使其他面向列的解决方案更快。可以这样想:您可以“预先加入”列族中的数据,只要您了解您正在交易快速访问以应对过多的数据量和较慢的插入速度。

-t。

于 2012-11-02T18:54:55.927 回答