1

我是分析服务和数据湖的新手,从事 POC 工作。我使用数据工厂从 blob 存储中提取一些 TSV 数据,这些数据在逻辑上被组织为小的“分区”blob(数千个 blob)。我有一个根文件夹,可以认为它包含整个表,其中包含逻辑上表示按客户分区的子文件夹 - 这些包含逻辑上表示按日期对客户数据进行分区的子文件夹。我想将整个文件夹/blob 结构建模为 Analysis Services 中的一个表,但似乎无法弄清楚如何。我已经看到了从单个 ADLS 文件创建单个 AAS 表的博客文章和示例,但有关其他数据文件布局的信息似乎很少。我处理这个问题的方法是错误的,还是我只是遗漏了一些明显的东西?

4

1 回答 1

1

博客文章提供了有关将多个 blob 附加到单个表中的说明。

然后第3 部分博客文章描述了创建一些 Analysis Services 分区以提高处理性能。

最后,这篇文描述了连接到 Azure Data Lake Store(与之前帖子中的 Azure Blob 存储相反)。

我会使用这些方法在 Azure 分析服务中创建 20-200 个分区(而不是数千个)。分区通常应至少为 800 万行,以获得最佳压缩和性能。我认为这需要将几个 blob 附加在一起才能达到该大小。

于 2018-04-10T06:16:29.393 回答