0

我需要设计一个星型模式,它响应我未来的指标,稍后将在数据仓库中实现,但我的知识非常基础,我在开发模型时遇到了严重的困难

我不确定是否应该创建单独的星型模式,或者是否可以使用桥接表。

在此处输入图像描述

每个会话在单个频道上完成,但根据其时间间隔,可能会或可能不会观看超过 1 个节目

每个程序都有自己的分类(12 种可能的分类)

-TuneTime >> 开始 DateTime 会话(例如 2020-12-02 00:35:00)

-TuneDuration >> 会话持续时间(以秒为单位)

-StartDate >> 开始DateTime程序(例如2020-12-01 23:35:00)

-EndDate >> End DateTime Program (eg 2020-12-01 00:23:00)

最小时间粒度 = 15 分钟

我将不得不分析一系列与设备访问相关的指标,包括每个频道、分类、观看次数最多的节目的排名、每个频道的份额等。我们的想法是能够在预定义的日期获得这些数据范围由用户决定,并能够改变时间尺度,例如:

  • 每月每周
  • 按星期几(星期一,星期二,...)
  • 按每日时段(晚上,早上,...)
  • 每天(15 分钟间隔)

对我来说很明显我将不得不创建:

  • DIM_Time
  • DIM_Date

但是我如何评估事实表中每个程序的持续时间

我做了一个小示意图来可视化,它可能不会做任何事情:)

在此处输入图像描述

我对自己的推理没有信心,非常感谢一些帮助

4

1 回答 1

0

星型模式的起点应该是您希望聚合的度量以及您希望用来对这些度量进行切片、切块和聚合的属性。

您尝试实现的复杂性应在用于加载星型模式的 ETL 过程中处理,以便查询星型模式以生成所需信息很简单

于 2021-09-21T22:24:08.103 回答