-1

我在另一端有一个 RDBMS(SQL Server/Oracle)和一个 Hadoop 数据库。主键“客户”在两个数据存储中都很常见。

几个问题:

  1. 是否有可能拥有一个可以从 RDBMS 和大数据中提取数据并生成报告的数据集市?什么是工具示例?
  2. 数据集市本身是否需要成为 RDBMS 存储,或者它可以是一些内存中的东西?
  3. 在这种环境中运行数据分析的最佳方式是什么?
  4. 数据可视化呢?

或者我应该将所有数据放入 RDBMS 数据仓库,然后解决这些问题?

4

1 回答 1

1

数据虚拟化或数据联合是您正在寻找的——即访问将根据需要访问多个资源的单个源的能力。

数据库通常在这方面有一些有限的功能,可以让您定义外部表,例如Oracle 和 HDFS 的链接

于 2014-10-26T11:43:08.153 回答