我们正在开发一种产品,该产品可用于开发预测模型以及对数据进行切片和切块,以提供 BI。
我们有两种数据访问要求。
对于预测建模,我们需要每天读取数据并逐行进行。在这种情况下,普通的 SQL Server 数据库就足够了,我们没有遇到任何问题。
如果对大数据进行切片和切块,例如 1GB 的数据,我们可以说是 300 M 行。我们希望以最短的响应时间轻松地转换这些数据。
当前的 SQL 数据库在这方面存在响应时间问题。
我们希望我们的产品能够在任何具有 2GB RAM 和 Core 2 Duo 处理器的普通客户端机器上运行。
我想知道我应该如何存储这些数据,然后如何为每个维度创建旋转体验。
理想情况下,我们将拥有一家大型公司按产品按地区按销售人员的每日销售额的数据。然后我们希望根据任何维度对其进行切片和切块,并且还能够执行聚合、唯一值、最大值、最小值、平均值和其他一些统计功能。