13

我知道什么是数据仓库和什么是大数据。但我对数据仓库与大数据感到困惑。两者相同但名称不同或两者不同(概念上和物理上)。

4

6 回答 6

7

我知道这是一个较旧的线程,但在过去一年左右出现了一些进展。将数据仓库与 Hadoop 进行比较就像将苹果与橘子进行比较。数据仓库是一个概念:干净、集成的高质量数据。我认为对数据仓库的需求不会很快消失。另一方面,Hadoop 是一种技术。它是一个处理大量数据的分布式计算框架。过去,数据仓库通常建立在关系数据库和数据仓库设备之上。然而,在过去几年中,RDBMS 出现了各种限制(面对不断增长的数据量,许可证成本激增,不适合查询图形和层次结构以及摄取非结构化数据类型等)。

如果你对所有细节感兴趣,我已经写了一系列关于这个主题的帖子。大数据时代的数据仓库。一个时代的结束?

于 2015-06-16T09:26:21.273 回答
1

我有一些很棒的幻灯片描述了 Hadoop 和数据仓库之间的区别,以及两者如何相互补充:

http://www.kai-waehner.de/blog/2014/05/13/hadoop-and-data-warehouse-dwh-friends-enemies-or-profiteers-what-about-real-time-slides-包括- tibco-examples-from-jax-2014-online/

于 2014-05-17T14:38:06.853 回答
1

我认为您会发现以下文章对您的想法非常有用。

It’s important to divide the techniques of data warehousing from the implementation. Hadoop (and the advent of NoSQL databases) will auger the demise of data warehousing appliances and the “traditional” single database implementation of a data warehouse.  
It is safe to say that traditional, single server relational databases or database appliances are not the future of big data or data warehouses.
On the other hand, the techniques of data warehousing to include Extract-Transform-and-Load (ETL), dimensional modeling and business intelligence will be adapted to the new Hadoop/NoSQL environments. 

来自: http: //gcn.com/blogs/reality-check/2014/01/hadoop-vs-data-warehousing.aspx

于 2014-04-29T13:20:28.637 回答
1

我发现这个http://www.b-eye-network.com/view/17017描述了大数据和数据仓库的区别

当我们将大数据解决方案与数据仓库进行比较时,我们发现了什么?我们发现大数据解决方案是一种技术,而数据仓库是一种架构。它们是两个非常不同的东西。技术就是这样——一种存储和管理大量数据的方法。数据仓库是一种组织数据的方式,以便具有企业的可信度和完整性。当某人从数据仓库中获取数据时,该人知道其他人正在将相同的数据用于其他目的。当有数据仓库时,数据的可协调性就有了基础。

于 2017-03-12T09:31:46.733 回答
1

也许这个观点可以帮助你:基本上数据仓库是一种架构,而大数据是一种技术。第一个成为近 20 年的流行趋势,而后者仅在最近十年才开始流行。

大数据和数据仓库都用于报告,可以称为面向主题的技术。这意味着它们旨在提供有关特定主题的信息(例如客户、供应商、员工甚至产品)。数据仓库在整体数据分析方面更为先进,而大数据的主要优势在于您可以从几乎所有知名来源(例如社交媒体甚至特定机器数据)收集和处理信息。

更多在这里gbksoft.com/blog/big-data-and-data-warehouse/

于 2019-11-28T10:47:15.527 回答
0

仓库存储实际数据。它存储了整个集群数据的一部分。数据仓库是用于报告和数据分析的系统。它是来自一个或多个不同来源的集成数据的中央存储库。它们将当前和历史数据存储在一个地方,用于创建分析报告。

对比

大数据是指在数字环境中产生的大规模数据。这种大数据一般规模大,生成周期短。它不仅包括数字数据,还包括文本和图像数据。大数据环境比以往更加多样化。由于数据类型多样,规模庞大,甚至可以分析和预测人们的意见和行为。此外,Machbase 数据库将推出具有仓库概念的企业版。

于 2018-03-29T08:45:15.383 回答