我正在做概念验证任务。任务是使用 Hadoop 技术实现我们产品的一个功能。
功能非常简单,我们有一个 UI 可以让您插入有关“网络问题”的详细信息。捕获有关此类问题的所有详细信息并将其插入到 Oracle DB 中的表中。然后,我们处理此表中的数据并计算健康评分。
我必须使用 Hadoop 而不是传统的 Db 所以我的问题是要做什么?HDFS上的黑斑羚?还是 Hbase 上的 Impala?还是Hbase?
我正在使用 cloudera VM 来实现 POC。
根据我的理解,Hbase 是 NoSQL 分布式数据库,它实际上是 HDFS 上的一层,它提供了 java API 来访问数据。Impala 是一个工具,它还提供 JDBC 访问以通过 Hbase 或直接通过 HDFS 访问数据。我对hadoop很陌生,有人可以帮忙吗?