问题标签 [snowflake-schema]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
480 浏览

oracle - 从现有数据库 (Oracle) 创建星形/雪花模式

我碰巧发现自己处于使用 Oracle SQL Developer 版本 1.5.5 的情况,并且有一个庞大的数据库,其文档非常差。我想创建一个星形或雪花模式,以便更好地理解数据。有没有简单的方法来做到这一点?

0 投票
2 回答
118 浏览

data-modeling - DWH 不是 Star-Schema 不是雪花不是 ER

我知道关于数据仓库架构的文献/理论以及应该如何设计。Bill-Imon ER 3NF 或 Kimball Star-Schema/Snow - flake Schema。

当我目前在 DWH 中工作并且它没有任何这些模式时,问题就出现了,它由 3 个大事实表组成,每个表都是很多维度表。(连接了 3 个大表中的 2 个) 在此处输入图像描述

那么它是什么样的架构呢?

提前致谢,恩里克

0 投票
1 回答
96 浏览

database-design - 数据仓库中的用户定义模式

我的 OLTP 数据库中有大约 7-8 个用户定义的模式(参考、财务、管理、ORG 等)。我确实有 ODS db,它几乎是 OLTP 上的副本。我想为此建立一个数据仓库。建仓库时推荐多少模式?如果采用雪花方法,我应该在 2-3 个模式中创建所有必需的表吗?

谢谢!

0 投票
1 回答
51 浏览

bigdata - 如果 datamart 是 datawarehouse 的逻辑划分,那么它在 datalake 中对应的是什么?

如果 datamart 是 datawarehouse 的逻辑划分,那么它在 datalake 中对应的是什么?在数据湖中是否有任何设计,如星形或雪花模式?

0 投票
1 回答
1210 浏览

aggregate - 处理两个事实粒度 - 维度模型

我有一个关于创建维度模型和处理不同粒度级别的问题。

我想知道这两种方法中哪一种最好,为什么。或者,如果有另一种更好的方法。

我使用的场景很简单:我有 2 个维度,Region 和 Customer 以及 1 个事实,Sales。

这变成了两个维度表,一个用于区域,另一个用于客户,其中包含销售的事实表如下所示:

在此处输入图像描述

现在我想按地区汇总销售额。但我不确定哪个是最好的方法。

我是否应该按地区汇总销售额,然后将数据加入事实表中,以便模型如下所示:

在此处输入图像描述

或者我应该创建一个新表来保存聚合值,其中键连接到事实和区域维度表,如下所示:

在此处输入图像描述

还是有另一种方法可以胜过这两种方法?

感谢您的智慧和投入。

谢谢

0 投票
2 回答
10645 浏览

sql - 在 Snowflake SQL 中向表中添加行 ID

我需要将具有唯一整数/哈希的列添加到表中以用作行 ID。

我用这个查询创建了一个表 DUPLICATES:

现在我需要为每一行添加一个包含唯一 ID 的列。我试过ALTER TABLE DUPLICATES ADD 'id' int identity(1,1)了,但是这会返回:SQL 编译错误:无法将具有非常量默认值的列 'id' 添加到非空表 'DUPLICATES'

我现在有点缺乏想法,因为关于 Snowflake SQL 的讨论还没有普及,而且 Snowflake 的帮助页面也没有帮助我。

0 投票
2 回答
461 浏览

liquibase - Liquibase 尝试使用不正确的数据类型将数据插入列

我正在尝试连接 liquibase 以与 Snowflake 一起使用。我得到它来构建和启动。它创建 DatabaseChangeLog 和 DatabaseChangeLogLock 表。但是当尝试将数据插入到 DatabaseChangeLog 表中时,出现以下错误:

我找到了将 DATETIME 转换为 TIMESTAMP_NTZ 的代码,但这没有实际意义,因为 Snowflake 现在已经添加了 DATETIME 数据类型。如果 Liquibase 试图将元数据加载到不同的数据类型中,我应该如何将元数据加载到该表中?

我愿意接受所有建议,但我不是 java 程序员,所以如果我必须创建 java 程序来纠正这个问题,这将不是一件容易的事。

0 投票
1 回答
692 浏览

sql - Snowflake DB UDF 可以执行 SQL 命令吗?

我在 Snowflake 中有一个要求,我必须生成一些 SQL,然后执行它来创建一个新表。

我已经通过创建 UDF 成功生成了 create table 语句(目前是硬编码的)

这将输出以下内容

我现在需要创建一个 UDF 来执行这个 create table 语句,但由于它似乎只返回字符串之类的东西,我无法通过例如从另一个函数调用它来执行它。

然后我尝试运行该函数来创建表

我不知道我想要的是否可以完成,如果不可能,我会很生气......

这可以在雪花数据库中完成吗?

0 投票
0 回答
426 浏览

parquet - 雪花连接器的镶木地板文件格式

我正在使用 Spark 连接器将 Hadoop 中的表写入雪花,但我在 Hadoop 中的文件位于 Apache Parquet 中。

用 Snowflake 编写时,它是以 csv 格式编写的,它应用默认分隔符“,”,但我需要应用“^”作为分隔符。我怎样才能做到这一点?

df.write.format(SNOWFLAKE_SOURCE_NAME).options(sfOptions).option("dbtable", "t24122018").mode(SaveMode.Overwrite).save

0 投票
1 回答
105 浏览

data-warehouse - 如何将透视列结构转换为维度表

我想将带有透视列的表结构转换为维度表和事实表。

如何使用模型强制星型模式从具有以下结构的数据创建药物维度表

数据结构