我在电信行业工作。我们处理大型数据集和复杂的 EDW(企业数据仓库)模型。我们从 Teradata 开始,几年都很好。然后数据呈指数级增长,正如您所知,在 Teradata 中进行扩展非常昂贵。因此,我们评估了 EMC,即 green plum、oracle exadata、hp Vertica 和 IBM netteza。
在速度上,生成 20 个报告是这样的:1. Vertica,2. Netteza,3. green plum,4. oracle
在压缩比方面:Vertica 具有天然优势。其中,IBM 也不错。根据基准,最差的是 emc 和 oracle。正如预期的那样,它俩都想出售大量的存储和硬件。
可扩展性:都可以很好地扩展。
加载时间:这里 emc 最好,其他(teradata、Vertica、oracle、IBM)也不错。
并发用户查询:Vertica、emc、青梅,当时只有IBM。Oracle exadata 在任何类型的查询案例中都比较慢,但比它的老派 10g 好得多。
价格:Teradata > Oracle > IBM > HP > EMC
注意:需要比较苹果和苹果,相同的核心数、内存、数据量和报告
我们选择 Vertica 是因为硬件独立定价模式,定价较低且性能良好。现在,所有 40 多位用户都乐于生成报告而无需等待,并且它们都适合低成本的 hp dl380 服务器。它非常适合 olap /edw 用例。
所有这些分析仅适用于 edw/analytics/olap 案例。对于任何硬件或系统上的所有 oltp、丰富的 plsql、连接等,我仍然是 Oracle 的粉丝。Exadata 提供了不错的混合工作负载,但性价比不合理,并且仍然需要将 10g 代码迁移到 exadata 最佳实践(类似于 MMP、批量处理等),而且它比他们声称的要耗时。