问题标签 [snowflake-schema]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
804 浏览

sql - 在雪花中将字符串转换为日期

当我尝试运行此查询时,我一直在用奇怪的行为来解决我的问题。

结果图片

在所有情况下,我预计日期部分的输出为2013-8-01

不知道我在这里缺少什么。对 Snowflake 文档进行了研究,但没有得到任何具体的发现。任何帮助表示赞赏。

0 投票
1 回答
37 浏览

sql - 有没有办法在通信源中对回复进行建模?

我有一个包含以下列的表格:

communication_id| communication_date| company_id| customer_id| salesperson_id| medium| is_incoming| is_outgoing|communication_text

communication_id表格的粒度在哪里,medium可以是 等值phone,是销售人员角度的沟通方向的指标列sms。如果销售人员发送通信,我们将有一个 0和一个 1 。is_incomingis_outgoingis_incomingis_outgoing

所以,给定一个customer_idorder by communication_date,我有那个客户和他们的销售人员之间的交流信息。如果我看到销售人员有 2 次传入通信,然后与该客户有 1 次传出通信,那么我们的规则/推理是将传出通信标记为回复,依此类推。按照这个逻辑,只有is_outgoing通信才能被回复。所以,我认为我需要做的是建立一个is_salesperson_reply列,指示通信是否是回复。我认为也有帮助的还有communication_id他们正在回复的通信的 assalesperson_replied_to_communication_id以及该通信的时间戳 as salesperson_replied_to_at

我要写的是一个选择查询,它输出销售人员沟通的摘要;我已经能够创建一个表格,其中包含每个销售人员以及通信总数、发送总数和接收总数。我现在想模拟他们做出的回复数量,也许是他们回复时所花费的平均时间。

我有一种感觉,我可能需要使用该array_agg函数或一些花哨的case语句,但我不确定如何。任何帮助表示赞赏!

0 投票
1 回答
1301 浏览

data-warehouse - 人力资源数据集市设计建议

我正在使用“数据仓库工具包”中概述的 Kimball 方法设计 HR 数据集市。

根据 Kimball 的设计,我计划有一个带有时间戳的、缓慢变化的维度来跟踪员工资料的变化(以支持对员工状态的时间点分析)和一个人数统计定期快照事实表来支持度量新员工、离职人员、休假、已付工资等。

我遇到的问题是,在某些情况下,我们的员工可以分配到多个角色/工作,并且每个人都需要单独跟踪(即我的事实的粒度必须在工作级别,而不是员工级别) .

Kimball 设计如何适应员工和角色/工作形成这样的层次结构的场景?理想情况下,我希望避免为分配给员工的每个角色/工作重复员工档案数据(地址、人口统计等),但这是否意味着我需要对维度进行雪花化?

我一直在考虑的选项包括以下内容 - 我会对社区对此的任何想法或建议感兴趣,因此欢迎所有意见!

1)(见附件,设计 1)一种雪花式方法,其中员工表具有一对多链接角色表,而角色表又与事实表具有一对多链接。这里的优点是干净的员工维度,但我不想引入不必要的复杂性。有什么理由不应该将两个维度直接链接到事实表?我见过的雪花设计似乎没有这样做。

2)(见附件,设计 2)一个组合的员工/角色维度,其中每个员工都有每个分配角色的记录,但只有一个记录被标记为“主要角色”。可以通过约束“主要角色”标志来执行维度上的时间点查询。

在此处输入图像描述

0 投票
1 回答
66 浏览

sql - 用不同的序列时间填充事实表

我正在使用以下查询来填充我的事实表:

主要是我想将表格从特定时间加载到特定时间。所以如果我今天加载,我会得到从今天到最后一次加载的所有记录。

如果我在后天加载它,我将在加载时间之后获取今天的数据,直到后天。

我的意思是没有重复的行或数据。我应该怎么办 ?有什么想法吗?

先感谢您

0 投票
1 回答
1487 浏览

snowflake-cloud-data-platform - 在 SnowFlake 中动态创建表(使用暂存区的 JSON 数据)

有没有办法通过使用暂存区的 JSON 文件动态创建表(带列)?

我使用了命令:'copy into TableName from @StageName;'

这将我的 json 文件中的所有不同行放入单个列中。

在此处输入图像描述

但是,我想要不同的列。例如,第 1 列应为“IP”,第 2 列应为“操作系统”,依此类推。

先感谢您!!

0 投票
1 回答
489 浏览

snowflake-cloud-data-platform - 尝试将文件上传到雪花时失败

我注册了一个雪花跟踪帐户,并尝试将本地文件上传到雪花。按照教程https://docs.snowflake.net/manuals/user-guide/data-load-internal-tutorial.html

我在 Windows 平台上,运行 put 命令时失败。 https://docs.snowflake.net/manuals/user-guide/getting-started-tutorial-stage-data-files.html​ 错误是

john#MYWAREHOUSE@MYDATABASE.PUBLIC>put file://c:\temp\load\contacts*.csv @my_csv_stage auto_compress=true;

无法解析配置文件:C:\Users\john/.aws/credentials 你能帮忙吗?

0 投票
1 回答
651 浏览

snowflake-cloud-data-platform - 雪花中的错误“无法评估不支持的子查询类型”

运行以下代码时,我看到以下错误。

无法评估不受支持的子查询类型

当我注释第三个 select 语句并运行查询时,查询正在运行结果。select此错误在最后一条语句中弹出。

我可以知道如何将最后一个 select 语句放在我的查询中吗?

0 投票
2 回答
3477 浏览

sql - 有没有将数据从雪花获取到 s3 的最佳方法

是否有将数据从雪花获取到 s3 的最佳方法。? 雪花显示的数据将在 s3 中,但我们无权访问该存储桶。而且我们只需要从 Snowflake 中获取特定的表,而不是整个数据。

0 投票
2 回答
229 浏览

unix - 使用 Unix 命令在雪花中解密

我面临一个问题,我必须在 Snowflake 中解密一个 db 列。解密该列的转换是一个 unix 命令。如何在 Snowflake 中实现此解密。

0 投票
1 回答
2576 浏览

c# - 雪花中的查询超时问题

当查询未能在 45 秒内执行时,我遇到了查询超时问题。我需要一些关于如何为雪花设置查询超时的建议。仅供参考,我尝试query_Timeout在雪花文档中提到的连接字符串中使用参数。

认为这是关于 ODBCcommandTimeout的,我想通过设置来测试它是否失败commandTimeout=1(Second),令人惊讶的是它没有失败。我也试过connectionTimeout=1(Second)

我收到以下错误

错误 [HY000] [Snowflake][Snowflake] (15) 查询已超时。用户指定的超时时间(秒=30,已用时间=45)