我想问一下 etl 和事实表。
很可能,我的事实表的结构是这样的:
Id | Name | QuestionAanswer | QuestionBanswer | QuestionCanswer
我有这样的尺寸:
- 用户维度
- 问题维度
- 问题分期
QuestionStaging 数据来自 csv 文件,其名称在结构上是随机的,如 A257_IDr、H1_ques1、H2_ques2、H3_ques3。前任 :
A001 | 1 | 2 | 1 |
其中A001
-> 用户 ID 和 1,2,1
-> 用户对以下问题的回答。
QuestionDimension的结构如下:
SK_Question | ID_Question | IDAnswer
前任。我有以下问题,例如=
贵公司今年的利润如何?坏:好:最好
那么表中的数据结构如下:
Sk_Question | IDQuestion | IdAnswer | AnswerDetail
1 Q1 1 Bad
2 Q1 1 Good
3 Q2 1 Best
我的期望事实表可能会:
SK_USer |Id | Name | QuestionAanswer | QuestionBanswer | QuestionCanswer
1 A001 Richard 1 1 2
或者
1 A001 Richard Bad Bad Good
对于这些情况,我应该使用什么数据流组件或控制流?