问题标签 [fact-table]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
25700 浏览

database-design - 为什么在维度建模中的事实表上(不需要)主键?

我听说过一些关于事实表不需要 pk 的参考资料。我相信每张桌子都应该有一个pk。

如果没有 pk 和 10+ 个外键,一个人如何理解事实表中的一行。

0 投票
1 回答
1076 浏览

foreign-keys - 数据仓库如何将带有外键的事实表连接到主键包含两个属性的维度表

我想设计我的数据仓库事实维度模式,事实表应该有几个外键,Aid,Bid,Cid....分别指维度表A,B,C,....。但是,维度表 C 具有唯一的键(Aid、Cid)。在这种情况下,是否可以使用两个键(Aid 和 Cid)将事实记录链接到维度表 C?或者我应该应用另一个只包含主键的维度表?非常感谢!

0 投票
1 回答
887 浏览

database - 事实表设计混乱 - 计算措施等

我对数据仓库和维度建模很陌生,我需要澄清一些事情。我目前有以下尺寸:

  • DimProducts - 关于产品的信息。
  • DimMaterials - 有关进入产品的材料的信息。
  • DimLocation - 不同的商店位置
  • DimTime - 带有年、季度、月、周、日的标准时间维度。

现在出现了关于事实表的困惑。目前有以下措施:

  • 收入
  • 花费

问题:

  1. 我也想将净利润作为衡量标准,但由于它是计算衡量标准,它应该是事实表中的一列还是应该在报告级别计算?关于计算度量的约定,我有点不清楚。
  2. 我还想知道在某个时间点有多少原材料可用,以便我可以计算我可以生产多少产品(例如,1 辆自行车有 2 个轮子意味着 3 月份有 50 个轮子可以生产 25 辆自行车3 月)。我应该添加一个名为原材料数量的事实吗?

我有一种感觉,我正在处理错误的问题 #2,我需要创建单独的事实表来处理该问题。非常感谢任何关于我是否走在正确轨道上的建议/提示。谢谢!

0 投票
2 回答
1790 浏览

sql - 在给定场景中,事实表中是否需要/推荐 Id 列

我在 SQL Server 2012 中使用具有以下结构的事实表:

我在填充因子为 100 的列上有一个聚集索引。插入到该表中的数据几乎总是按和Date的升序排列。DateMinuteNumber

  1. 我想知道 - 在给定的场景中是否需要使用 Id 列?它有任何性能影响吗?或者我可以安全地消除它。

  2. 我还想知道在Date列上具有聚集索引是否就足够了(会有许多记录具有相同的日期,甚至相同的日期和相同的分钟数),还是有一个组合多个列的聚集索引更好;两种方法对性能和存储的影响是什么?

我是新手,任何帮助将不胜感激。

0 投票
1 回答
305 浏览

ssas - 数据仓库 - 多维模型 - 事实表小于维度表

我正在研究客户维度表大于事实表的数据仓库项目。维度表和事实表是从 CRM 系统创建的。

事实表监控活动,例如向客户发送信件或客户呼叫寻求帮助。一半的客户没有活动,其余客户的活动很少;大多数有活动的客户只有一个活动。

我不确定星型模式是否是项目的最佳解决方案。您是否从事过类似的项目以及解决方案是什么。

0 投票
1 回答
612 浏览

mysql - 将历史数据存储在单独的事实表中

我是数据仓库项目的新手,想在这里寻求社区的建议。

我需要创建一个数据仓库,可以以最有效/最便宜的方式从中提取历史和当前信息。在这个特定的示例中,我们正在处理网站用户和偏好。

我们有一个 Users 表,一个名为 Preferences 的属性表(带有首选项的名称和 ID),然后是一个名为 User_Preferences 的连接事实表。与其将所有历史和偏好更改/删除/添加存储在 User_Preferences 表(可能是数百万行)中,不如拥有 2 个表更有意义,一个用于当前偏好,一个包含所有偏好历史(使用是当前标志)?在 ETL 过程中,我们会将 prod db 中的所有历史数据加载到一个 dw 表中,然后仅将新 dw 表中 isCurrent=1 的那些记录插入到另一个仅存储当前首选项的 dw 表中。

从业务的角度来看,大多数查询将在当前数据上运行,因为客户只关心用户当前的偏好。更少数量的查询需要返回有关用户对企业内部利益的偏好的完整历史信息。

感谢您的任何帮助,您可以提供!

0 投票
1 回答
814 浏览

data-warehouse - Factless Fact Table 与 Dimension Table 具有 1:1 的关系

数据源视图

我正在查看旧的数据仓库,并且在无事实事实表 (Fact_contact) 和 Dim_Incident 之间遇到了不寻常的 1:1 关系。

通常,Fact_Contact 用于记录案例/票证/查询。一些客户是匿名的;因此,存在用于不同计数的 uniqueCustRef 和 CustomerRef “事实”。

事实和维度表之间的 1:1 关系感觉不对。这是推荐的解决方案吗?目前,没有文档说明它为何如此设计。

谢谢你。

0 投票
4 回答
1348 浏览

mysql - 如何将数据导入星型数据仓库。

我在网上到处搜索,以了解如何将数据导入星型模式数据仓库。网上很多东西都解释了星型模式和数据仓库的设计,但没有一个解释数据是如何准确地加载到 DW 中的。这是我到目前为止所做的:

我正在尝试为每个球员应用高中篮球统计数据。

我有:

  1. 所有球员姓名、身高、位置和号码的列表
  2. 所有高中的名单
  3. 所有时间表的列表
  4. 会议清单
  5. 本年度每位球员的统计数据(得分、篮板、抢断、出场次数等)。

我假设统计数据将是我的事实表,其余的是我的暗表。

现在是百万美元的问题——世界上如何正确地将数据转换为那种格式?

我尝试简单地将它们导入到各自的表中,但不知道它们是如何连接的。

示例:有 800 名玩家和 400 所学校。每所学校都有一个唯一的 id(主键)。我将玩家上传到昏暗的玩家和学校到昏暗的学校。现在我该如何连接它们?

请帮忙。提前致谢。很抱歉漫无边际:)

0 投票
2 回答
536 浏览

ssas - 我需要定义事实表或维度表吗?

我正在尝试使用 OLTP 数据库构建数据仓库,并且想知道是否需要先定义事实表或维度?

请帮忙?

问候瑜伽士

0 投票
0 回答
101 浏览

csv - powerpivot 从 CSV 文件填充事实表

我正在尝试 PowerPivot 来分析一些金额。

我已经准备好我的数据总线矩阵,创建了数据模型,创建并填充了所有维度表。

现在我知道我的事实表应该是什么样子了,我的维度的所有外键加上金额。

除此之外,我还有一个 CSV 文件作为源文件。此 csv 文件的每一列都与维度内的一个值(一行)相关,最后 3 列是具有分析值的金额。

我的问题是我不知道如何从这个 csv 文件中用所有必要的 FK + 金额填充我的事实表。