问题标签 [fact-table]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
301 浏览

ssis - 从starschema ETL 到数据仓库

我们正忙于学校的一个项目。我们必须建立一个数据仓库,但我卡住了。

我有以下starschema:

昏暗位置:

Location_key(主键)

城市

暗淡条件:

Condition_key(主键)

描述(例如:好、差、非常差、非常好等)

昏暗时间:

时间键

日期

四分之一

等等

事实表地面:

Time_Key(外)

Location_Key(国外)

Condition_Key(外文)

位置维度应该是一个包含各种位置的表格。条件维度应该是一个包含好、坏、不太坏、非常好等条件的表格。时间维度应该是一个包含所有日期、季度等的表格。

我应该知道的是:“我想知道在某个日期的某个地点,地面有某种状况”

示例:1 月 20 日星期一,阿姆斯特丹的地面状况不佳。

我有一些我应该用来填充这些维度和事实的转储。但我不知道最好的方法是什么,以及如何填写事实表。我已经在 SSIS 中填写了维度,效果很好,但我无法填写事实表。(尝试过:多次查找、合并、合并连接)有人可以分步告诉我我应该如何制作数据仓库并填写它(最好的方法)?

对不起,我的英语不好。

非常感谢帮助。

谢谢!!

0 投票
3 回答
4277 浏览

data-warehouse - 数据仓库设计——如何设计事实表?

我是 DW 的新手,我需要为一个电子商务网站创建一个非常简单的仓库。

维度表

  • 日期维度表(id、年、季度、月、日)
  • 时间维度表(id、小时、分钟)
  • 产品维度表(id、产品名称、价格、类别id)
  • 产品类别维度表(id、类别名称)

事实表

  • 每个产品的销售额(日期 ID、产品 ID、销售计数、价格总和)

此事实表适用于“6 月份售出多少产品”等问题。

但我需要回答诸如“6 月份哪个类别的产品销量最多?”之类的问题。或“星期三一天中最成功的时间是什么时候?”。

我看到两种可能性:

  1. 我可以在产品事实表中添加新列(类别 ID 或时间 ID)。但是这个id会改变表的粒度
  2. 我可以为类别创建另一个事实表,其中将包含有关类别的事实。但这(在我看来)是在浪费磁盘空间,不是吗?

哪种可能性是正确的?

0 投票
1 回答
3143 浏览

loading - 我已经填充了维度 - 如何填充事实表?

我已经填充了 4 个维度表,它们是时间昏暗、站点昏暗、废弃昏暗和工作类型昏暗。

我已经在临时表中计算了最终事实表中所需的度量,但是如何将维度 ID 和度量转移到事实表中?

事实表应该以这些列结束

数据还需要按 4 维 ID 进行分组。

0 投票
2 回答
533 浏览

sql - 从维度表设置事实表中的 ID

在我的废弃呼叫维度表中,我有 ID 1 代码 NO , ID 2 代码 YES 我想根据呼叫是否使用连接被放弃,将这些 ID 加载到事实表中。

我遇到的问题是,我的数据库中的 Abandoned 值为 NULL 表示 NO 和 1 表示 YES。

所以当我加入

没有结果?

有什么想法吗?

基本上需要的是:

如果度量中的废弃值为 null,我希望废弃维度中的废弃 ID 为 2,如果不为 null,则废弃 id 为 2

谢谢

0 投票
1 回答
283 浏览

data-warehouse - 建模数据仓库:Alter 表还是 2 事实表?

我实际上是在建模一个数据仓库

在我的一个事实表中,我有 3 个数据(我想分析的数字)。问题是我将首先填写其中一个数字,然后(几天)填写其他 2 个数字。

在 DW 中做这件事是一件坏事吗(因为“禁止修改表”法)?

我想到的另一个解决方案是将第一个数字放在第一个事实表中,将其他 2 个放在第二个事实表中。当然,2 FT 将链接到相同的维度表。这个解决方案对我来说似乎不错,但以后比较数据可能有点重。

--

我说的数据是关于工作时间的。首先,员工将他的工作时间(未经验证)放入数据库中,这是我的第一个属性(Qe)。然后老板验证或修改(或不)这个数据,它给了我另一个属性(Qa)有时两个属性会同时加载到DW中(如果快速验证),有时不是

那么您如何看待它,哪种解决方案更好/更清洁?

谢谢你的帮助

0 投票
3 回答
1627 浏览

relational-database - 了解数据仓库中的事实表

使用基本星型模式,我被告知事实表的行数至少等于每个维度中行数的乘积。

例如,3 个产品、5 个促销和 10 个商店意味着事实表应该至少有 150 条记录,而不管产品实际上在哪里进行了每个促销或存在于每个商店中。具体来说,空值将存在于例如产品没有特定促销等的情况下。

有人可以提供支持的学术来源,或者至少,请确认这个想法。

我问这个的原因是我的理解告诉我这会在事实表中创建大量无用的数据。

谢谢!

0 投票
1 回答
394 浏览

business-intelligence - 事实表事件使用什么维度”

我想建立一个包含事件信息的事实表。我建议的尺寸:

但我不明白的是,数据集市应该保存有关事件的信息,而且我在一些 DWH 设计中注意到事件也被用作维度。我告诉自己,如果事实表上的所有信息都已经在“事件”维度上,那么其他维度(即位置维度、时间维度)会有什么好处?计算的措施是“事故成本”(每月)和事故数量(每月)

0 投票
2 回答
6720 浏览

ssis - 查找代理键和填充事实表

我有 8个代理键,我需要在维度表上查找并填充事实表。我为维度表创建了8 个查找,然后使用合并连接排序组件将数据合并到一个结果集以插入到维度表中。我担心的是在我进行插入之前会发生很多合并和排序,并且性能不好。实现我上面解释的最佳方法是什么?

0 投票
9 回答
322070 浏览

database - 事实表和维度表之间的区别?

在阅读有关业务对象的书籍时,我遇到了术语事实表和维度表。

我想了解维度表和事实表之间的区别是什么?

我在互联网上阅读了几篇文章,但我无法清楚地理解..

有什么简单的例子可以帮助我更好地理解吗?

0 投票
2 回答
105 浏览

sql - 在事实表中识别百分比

我是编程新手,找不到答案。

我有以下维度(表格)和事实表:

  • 客户:CustomerId , HomeRegion
  • 区域:RegionIdRegionName
  • 我的时间:id,我的小时
  • 事实表:CustomerIdRegionIdTimeIdFactId

我必须报告为:HomeRegionHourRegionNameUserPercentage

例子

如示例所示,只有 3.67% 的家乡是A 的人会在上午 9 点搬到B,依此类推。

我应该创建一个类似的。

问题是获取用户百分比。这是我到目前为止所做的代码。