1

我是 DW 的新手。什么时候应该使用 Datamart 这个词,什么时候应该使用 Datawarehousing 这个词。请举例说明,可能是你自己的例子,也可能是 Adventureworks 方面的例子。

4

1 回答 1

1

我不在 MS SQL Server 上工作。但这是一个带有业务用例的通用示例。

让我为此添加另一个术语。首先,有一个transactional database与您的应用程序交互的 main (显然,假设您有一个要与之交互的应用程序)。数据被写入Master database(希望您正在使用Master-Slave replication),同时被复制到药膏中。根据业务和报表需求,ETL对应用程序数据进行清洗和处理,并将数据聚合并存储在一个denormalized表单中,以提高报表性能并减少连接数。业务用户可以随时使用复杂的预先计算的数据进行报告和分析。这是dimensional database- 这是主要事务数据库的非规范化形式(最有可能在3NF中)。

但是,您可能知道,所有企业都有不同的支持系统,这些系统也以电子表格csv平面文件的形式引入数据。此数据通常用于单个域,例如呼叫中心、集合等。我们可以将每一个这样的独立域数据称为数据集市。来自不同领域的数据也由 ETL 工具进行操作,并denormalized以自己的方式进行。当我们将所有的datamartsdimensional databases用于解决业务的报告和分析问题结合起来时,我们就得到了一个数据仓库。

假设您有一个主要应用程序,在网站上运行 - 这是您的主要业务。您在该网站上拥有所有主要的消费者互动。那会给你你的primary dimensional database. 对于消费者支持,您可能有一个单独的解决方案,例如在您的公司中实施的AvayaGenesys - 他们将在相同(或可能不同的服务器)上为您提供数据。您准备ETLs将该数据加载到您自己的服务器上。您将结果数据称为data marts. 你将所有这些东西结合起来得到一个data warehouse. 我知道,我在重复,但这是故意的。

于 2015-06-19T11:53:00.197 回答