3

对 NoSQL 数据存储的建议,以便我们可以轻松推送数据并生成实时 Qlikview 报告?

简单意味着: 1. Qlikview 支持读取(可用连接器,否则可以编写 JDBC 连接器,否则可以编写自定义 QVX 连接器到数据存储)

  1. 轻松适应模式或无模式的变化。我们经常改变我们的模式......
  2. Java 对写入的支持
  3. 超快读取——实时增量访问,以及对时间范围内旧数据的批量访问。我读到 Cassandra 擅长射程。
  4. 相当快的写入
  5. 合理的大数据存储 - 每天存储 2000 万行,每行约 200 字节
  6. 如果它可以扩展一年的数据会很好,弹性不是那么重要。
  7. 易于使用、安装和运行。查看最少的设置和配置时间。
  8. Matlabe 支持即席查询

最初我认为我们不需要分布式系统,但是集群是可能的。

我看过 Mongodb、Cassandra 和 Hbase。由于(理论上)性能较慢,我认为通过 REST 不是一个好主意。

我目前倾向于 MongoDB,因为它易于使用、支持 matlab、完全没有模式、支持 Qlikview(可用 beta 连接器)。但是,如果有人可以提出更好的建议,那就太好了!

4

1 回答 1

0

根据您将使用的服务器基础设施,我想最好的选择是亚马逊的 NoSQL 服务,在aws.amazon.com中可用。

事实上,由于存储数据的方式,任何数据库在云基础设施中的性能都会很差,例如带有 EBS 的亚马逊 EC2 对于此任务来说非常慢,需要您在 raid 中连接多达 20 个 EBS 卷才能获得不错的速度. 他们解决了这个问题,创建了这个我从未使用过的 NoSQL 服务,但看起来不错。

于 2012-03-12T03:57:18.787 回答