我正在考虑用于数据仓库和商业智能的各种技术,并且遇到了这个名为 Hadoop 的激进工具。Hadoop 似乎并不是完全为 BI 目的而构建的,但有一些参考资料表明它在该领域具有潜力。( http://www.infoworld.com/d/data-explosion/hadoop-pitched-business-intelligence-488)。
不管我从互联网上获得的信息多么少,我的直觉告诉我,hadoop 可以成为传统 BI 解决方案领域的颠覆性技术。关于这个主题的信息确实很少,因此我想在这里收集 Guru 关于 Hadoop 作为 BI 工具的潜力的所有想法,与Oracle Exadata、vertica 等传统后端 BI 基础设施相比。对于初学者,我想问以下问题 -
- 设计注意事项- 使用 Hadoop 设计 BI 解决方案与传统工具有何不同?我知道它应该有所不同,因为我读到无法在 Hadoop 中创建模式。我还读到一个主要优势将是完全消除 Hadoop 的 ETL 工具(这是真的吗?)我们是否需要 Hadoop + pig + mahout 来获得 BI 解决方案?
感谢和问候!
编辑 - 分解成多个问题。将从我认为最重要的那个开始。