背景:
我们需要整合全国的销售数据来做分析
我们的互联网连接/IT 专业知识/IT 投资不是很强大,因此完整的 BI 解决方案是不可能的
我尝试了几个 SaaS BI 解决方案(GoodData、ZohoReports),虽然它们很好,但它们似乎不能完全支持我们需要的东西
我们正在查看每 2 个月大约 200 万条记录
我目前的做法
我们的 (10) 个站点目前从其所有分支机构收集数据,并将它们整合到 1 个带有数据透视表的 Excel 文件中并嵌入源数据
在总部,我将要求 10 个站点定期发回这些 Excel 文件
我们将这些 Excel 导入我们的 MSSQL 服务器
将有一个主 Excel 文件,它也将具有相同的数据透视表(与来自站点 Excel 文件的数据一样),数据源是 MSSQL 服务器
更多细节
为了测试,我目前在笔记本电脑上使用 MSSQL 2008 Express
到目前为止,我导入了过去 2 个月的事务,MSSQL 中的 1 个表中有 200 万+ 行(我们只使用 1 个表,对应于我们常见的数据透视表结构)。数据库大小约为 600 MB
在主 Excel 文件中,如果不包括源数据,它只是 < 10MB。包括源数据会将大小增加到 60 MB(所以我认为 Office 2007 会自动压缩数据?)
我尝试使用 Pivot(拖放字段),到目前为止性能还可以(我的笔记本电脑规格:C2D T7200、3GB RAM、Windows XP)
所以我的问题是:
如果我们正在查看全年事务(MSSQL 2008 Express 中大约有 1500 万行,大小为 3.6 GB),那么 SQL Express 中的 1 个表中的 1500 万行有什么问题吗?
当时数据透视表是否存在任何性能问题?它仍然可以嵌入源数据吗?(我用谷歌搜索但没有找到 Excel 2007 可以嵌入的源数据的最大大小)
关于我们如何更好地做到这一点的任何其他建议?鉴于我们买不起完整的 BI 解决方案,您可以推荐任何轻量级/预算/SaaS BI 吗?
谢谢