4

我知道星型模式和雪花模式之间的基本区别——雪花模式将维度表分解为多个表以便对其进行规范化,星型模式只有一个“级别”维度表。但是雪花模式的维基百科文章说

“有些用户可能希望向数据库提交查询,使用传统的多维报告工具,这些查询无法在简单的星型模式中表达。这在客户数据库的数据挖掘中尤其常见,其中一个共同要求是定位客户之间的共同因素“谁购买了满足复杂标准的产品。通常需要一些雪花来允许简单的查询工具形成这样的查询,特别是如果在最初设计数据仓库时没有预期提供这些形式的查询。”

什么时候不可能在星型模式中编写查询,而对于相同的基础数据可以在雪花模式中编写?似乎星型模式总是允许相同的查询。

4

2 回答 2

6

对于数据挖掘,您几乎总是必须准备数据——主要是作为一个“平面表”。

它可能是查询、准备好的视图或 CSV 导出——取决于工具和您的偏好。

现在,要正确理解那篇文章,一个人可能不得不在作者写这篇文章时抽同样的东西。

于 2011-07-26T12:14:39.407 回答
0

正如您所提到的,从关系数据库开始为数据挖掘准备一个平面表并非易事,雪花或星型模式只能在一定程度上起作用。

但是,有一个名为Dataconda的软件可以自动从数据库创建一个平面表。

基本上,您在关系数据库中选择一个目标表,dataconda 通过向其添加数千个新属性来“扩展”它;这些属性是通过执行涉及多个表的复杂查询获得的。

于 2015-02-11T05:34:56.863 回答