-2

Can someone tell me the similarities and differences between Big data and Data Lakes.

Can't find a satisfactory answer anywhere.

4

3 回答 3

2

大数据是一个以非常不同的方式使用的术语,甚至可以称之为流行语。通常,它被用作数字技术、数字化工业 4.0以及与数字化转型相关的许多主题的统称。

在不太一般的解释中,大数据只是指复杂的大型数据集。术语“大”指的是三个维度(参见Wikipedia on Big Data

  1. 体积,即数据集的大小
  2. 生成数据量的速度
  3. 各种数据类型和来源

数据湖是指一种存储大数据的方法。存储数据的其他可能性是传统数据库,一方面也称为关系数据库管理系统 (RDBMS),另一方面是数据仓库,参见例如Data Lake vs. Data Warehouse vs. Database:有什么区别?

于 2019-06-06T14:33:04.733 回答
0

大数据和数据湖是两个不同的东西。数据湖是一个概念,您可以在其中存储所有数据并使用不同的机制轻松访问。数据湖可以在 s3 或 redshift 或任何其他存储平台上维护。大数据是用于处理大量数据的术语。它主要参考 Hadoop、Spark 等大数据解决方案。

于 2019-03-22T19:07:50.967 回答
-1

我认为,我们无法比较和区分这两个术语,因为数据湖是大数据的同义词。数据湖=企业数据+非结构化数据+半结构化数据。

另一方面,它是数据存储库,您可以存储任何类型的数据并用于分析目的。大多数数据将存储在 Hadoop 文件系统 (HDFS) 中,其中在“大数据”下,涉及存储和其他一些处理技术。

于 2019-01-03T14:06:26.013 回答