0

我们正在开发一种产品,该产品可用于开发预测模型以及对数据进行切片和切块,以提供 BI。

我们有两种数据访问要求。

对于预测建模,我们需要每天读取数据并逐行进行。在这种情况下,普通的 SQL Server 数据库就足够了,我们没有遇到任何问题。

如果对大数据进行切片和切块,例如 1GB 的数据,我们可以说是 300 M 行。我们希望以最短的响应时间轻松地转换这些数据。

当前的 SQL 数据库在这方面存在响应时间问题。

我们希望我们的产品能够在任何具有 2GB RAM 和 Core 2 Duo 处理器的普通客户端机器上运行。

我想知道我应该如何存储这些数据,然后如何为每个维度创建旋转体验。

理想情况下,我们将拥有一家大型公司按产品按地区按销售人员的每日销售额的数据。然后我们希望根据任何维度对其进行切片和切块,并且还能够执行聚合、唯一值、最大值、最小值、平均值和其他一些统计功能。

4

2 回答 2

1

您也可以使用PowerPivot来执行此操作。这是 Excel 2010 的免费插件,可以处理、切片+切块等大型数据集。

如果您想围绕它编写代码,您可以使用SSAS 数据库连接器连接到 PowerPivot 数据库(实际上是一个 SSAS 多维数据集)

希望有点用。。

于 2011-07-05T12:00:59.243 回答
1

我会在该数据之上构建一个内存中的多维数据集。举个例子,icCube在单核 i5 上对超过 50M 行的 3/4 测量具有亚秒级的响应时间 - 没有任何缓存或预聚合(即,此响应时间在所有维度上都是恒定的)。

直接联系我们以获取有关如何将其集成到您的产品中的更多详细信息。

于 2011-06-30T06:41:27.543 回答