1

我有脚本可以从 RDBMS 中提取数据并填充数据仓库。有用。我想知道临时表是如何介于两者之间的。ETL的具体步骤是什么?尽管我的数据仓库已填充,但我的老师说我们需要使用临时表。它为什么如此重要?

请帮我。我现在很困惑。谢谢你。

我们需要从两个不同地点的两个不同办公室的数据库中提取数据。我将给出下表的详细信息。

lds_job_role

job_role_id:整数
job_role_desc:varchar
key_skill_1:INEGER
key_skill_2:INEGER
key_skill_3:INEGER Recommended_sal
:INTEGER

lds_account

account_id:INTEGER
acc_name:VARCHAR
acc_postcode:VARCHAR

lds_placement

Placement_id :INTEGER
plt_short_desc:VARCHAR
plt_required_start_date:DATE
plt_estimated_end_date:DATE
plt_actual_start_date:DATE
plt_renewal_no:INTEGER
plt_to_permanent:VARCHAR
max_salary:INTEGER
min_salary:INTEGER
actual_salary:INTEGER

mch_job_role

job_role_id:INTEGER
job_role_desc:VARCHAR
推荐_sal:INTEGER

mch_account

account_id:INTEGER
acc_name:VARCHAR
acc_postcode:VARCHAR

mch_placement

Placement_id: INTEGER
plt_short_desc:INTEGER
plt_required_start_date:DATE
plt_estimated_end_date:DATE
plt_actual_start_date:DATE
plt_actual_end_date:DATE
plt_renewal_no:INTEGER
plt_to_permanent:VARCHAR
max_salary:INTEGER
min_salary:INTEGER
actual_salary:INTEGER
supervisor_name:VARCHAR

以下是星型模式的事实和维度:

job_roe_dim

job_role_id
job_role_desc

time_dim

time_id
年份

account_dim

account_id
account_name

事实账户

Report_id
no_of_placements
工资
FK1_time_id
FK2_account_id
FK3_job_role_id

该练习告诉我们“处理数据质量问题、FACT 测量、标识符等”。我想我已经用脚本做到了,但我不知道如何展示它。也许这就是为什么需要临时表的原因?

4

0 回答 0