0

我在网上到处搜索,以了解如何将数据导入星型模式数据仓库。网上很多东西都解释了星型模式和数据仓库的设计,但没有一个解释数据是如何准确地加载到 DW 中的。这是我到目前为止所做的:

我正在尝试为每个球员应用高中篮球统计数据。

我有:

  1. 所有球员姓名、身高、位置和号码的列表
  2. 所有高中的名单
  3. 所有时间表的列表
  4. 会议清单
  5. 本年度每位球员的统计数据(得分、篮板、抢断、出场次数等)。

我假设统计数据将是我的事实表,其余的是我的暗表。

现在是百万美元的问题——世界上如何正确地将数据转换为那种格式?

我尝试简单地将它们导入到各自的表中,但不知道它们是如何连接的。

示例:有 800 名玩家和 400 所学校。每所学校都有一个唯一的 id(主键)。我将玩家上传到昏暗的玩家和学校到昏暗的学校。现在我该如何连接它们?

请帮忙。提前致谢。很抱歉漫无边际:)

4

4 回答 4

1

将数据导入数据库的方法有很多:使用内置加载器、脚本,或者最常用于 DW 环境的 ETL 工具。

关于您的事实表,我认为统计数据是指标,而不是交易。换句话说,您衡量的是交易,而不是指标本身。

于 2014-07-10T16:37:19.707 回答
1

使用 ETL 工具(E- 从源中提取数据,T- 转换数据或根据需要操作数据,L- 将数据加载到 DW 中),您可以安全可靠地将数据加载到 DW 中。

您可以使用 ETL 工具,例如:SSIS、Talend 等。

于 2016-11-02T08:23:14.333 回答
0

是的,“星”、“暗”、“事实”和“数据仓库”是合适的术语,但我宁愿从“实体”和“关系”来接近它......

您基本上已经定义了 5 个“实体”。每个实体(通常)表现为一个数据库表。写CREATE TABLEs. 确保PRIMARY KEY每个都包含一个;它将唯一标识表中的每一行。

现在想想关系。想想 1:many,比如 1 所高中有“很多”球员。想想很多:很多。

例如,对于 1:many,您将id高中的作为列在player表中。

对于 many:many 你需要一张额外的桌子CREATE TABLEs为您可能需要的任何人写下。

现在,读取数据,并INSERTs放入相应的表中。

之后,您可以考虑SELECTs提取有趣的数据。同时,决定什么INDEX(es)是有用的。但这是另一个讨论。

当你全部完成后,你会学到很多关于 SQL 的知识,并且可能会意识到有些事情应该以不同的方式完成。所以,准备好重新开始。把它想象成一个学习练习。

于 2016-11-05T19:24:32.033 回答
-1

You can use SQL server data tools for this project. SQL server Data tools consists of a SSIS,SSAS and SSRS.

Use SSIS to create a ETL process for your data in your database. Use SSAS to create dimensions, fact tables and cubes (You can do a lot more in this). Use SSRS to present the data in a user friendly way.

Lot of videos are available youtube.

于 2017-12-05T11:07:34.890 回答