1

我正在学习 MVA“介绍 Azure 数据湖”的课程,直到模块 2,在它突出显示的每个 vid 中,我们只为执行工作所花费的时间付费。

这让我感到困惑,如果它有趋势或意味着将我们所有交易历史数据的数据永久存储在其中,或者它只是用于暂时分析其中的交易部分,并在使用任何分析语言(即 USQL)对其进行计算之后,完成后,HIVE、PIG 和删除临时分析源。

换句话说:

它是创建一个临时表还是临时表并在其上分析数据并在 stats 结果后删除该表。或者数据湖倾向于或打算存储数据以供将来使用,如仓库,并根据业务需求对其进行分析,并且该存储的成本不高,但仅用于分析它的处理时间。

问候哈西姆兰

4

1 回答 1

2

您加载到 ADL 存储帐户或使用 U-SQL 或 Hive 作业(例如,使用 OUTPUT 语句或插入表中)写入的数据将存储在 ADL 存储帐户中并使用该空间。您的 ADLS 帐户中的空间不受任何集群大小的限制,并且会随着您的需求增加而增长。

于 2017-04-17T21:00:23.547 回答