我有一个应用程序需要对不同级别的聚合进行分析,这就是 OLAP 工作负载。我也想经常更新我的数据库。
例如,这是我的更新的样子(模式看起来像:时间、目标、源 ip、浏览器 -> 访问)
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
然后我想问一下上个月从 Firefox 浏览器访问 www.stackoverflow.com 的总次数是多少。
我了解 Vertica 系统可以以相对便宜的方式做到这一点(性能和可扩展性方面,但可能不是成本方面)。我在这里有两个问题。
1) 有没有我可以构建的开源产品来解决这个问题?特别是,蒙德里安系统的工作情况如何?(可扩展性和性能) 2)是否有 HBase 或 Hypertable 基础解决方案(显然,裸 HBase/Hypertable 无法做到这一点)?-- 但是如果有一个基于 HBase/Hypertable 的项目,可扩展性可能不会成为 IMO 的问题)?
谢谢!