对 NoSQL 数据存储的建议,以便我们可以轻松推送数据并生成实时 Qlikview 报告?
简单意味着: 1. Qlikview 支持读取(可用mongodb连接器,否则可以编写 JDBC 连接器,否则可以编写自定义 QVX 连接器到数据存储)
- 轻松适应模式或无模式的变化。我们经常改变我们的模式......
- Java 对写入的支持
- 超快读取——实时增量访问,以及对时间范围内旧数据的批量访问。我读到 Cassandra 擅长射程。
- 相当快的写入
- 合理的大数据存储 - 每天存储 2000 万行,每行约 200 字节
- 如果它可以扩展一年的数据会很好,弹性不是那么重要。
- 易于使用、安装和运行。查看最少的设置和配置时间。
- Matlabe 支持即席查询
最初我认为我们不需要分布式系统,但是集群是可能的。
我看过 Mongodb、Cassandra 和 Hbase。由于(理论上)性能较慢,我认为通过 REST 不是一个好主意。
我目前倾向于 MongoDB,因为它易于使用、支持 matlab、完全没有模式、支持 Qlikview(可用 beta 连接器)。但是,如果有人可以提出更好的建议,那就太好了!