3

我正在使用 postgreSQL 来存储和处理研究项目的数据。我可以使用 SQL、R 和 Python 进行编程,但我不是软件开发人员或系统管理员。我发现自己不断地聚合数据,然后希望看到单个记录对聚合中的单个单元格有贡献。记录包含文本字段,我使用 CASE 和 LIKE 语句来确定如何计算这些字段。我正在寻找一个允许我在不同级别和类型的聚合之间快速移动的 GUI,这样我在查看全局时不会失去对细节的访问。我相信我的问题的答案涉及 OLAP 和/或分面搜索,但如果可能的话,我希望推荐特定产品、开源和交钥匙。

谢谢你,-大卫

4

3 回答 3

2

Basically, you don't want to lose any of your detailed data, to allow for the drill-down OLAP operation.

In a data warehouse, the grain of say, customer orders, would be order line item, ie the most detailed.

What you should do is to figure out which aggregates to pre-calculate, and use a tool to do automate that for you. The aggregated data would go in its own tables.

A smart OLAP cube will realize when you should use an aggregate and re-write your query to use the aggregated data instead.

Check out Pentaho Aggregation Designer, as well as Mondrian OLAP server/Saiku pivot tables. All FOSS.

于 2013-08-21T16:50:12.447 回答
2

也许 Microsoft 的 Power Pivot 是适合您的工具。对于 Excel 2010,它是一个插件,您可以从 Microsoft 免费下载。对于 Excel 2013 和 Excel 作为 Office365(基于云的 MS Office)的一部分,它已经包含在内。不支持旧版本的 Excel。该工具是一种 OLAP 解决方案,旨在供业务用户在没有 IT 人员支持的情况下使用。数据以内部压缩格式保存在 Excel 工作簿中,针对快速分析进行了优化(数百万行不是问题),您可以使用与标准 Excel 中使用的公式语言非常相似的公式语言来定义计算,同时分析数据使用指向和单击数据透视表免费编写脚本。

于 2013-08-23T19:52:23.330 回答
2

icCube不是开源的,但允许从大局到细节(通过钻取或钻取)。根据您的 PostgreSQL 模型,设置多维数据集模型的工作可能很少。请注意,一旦设置了模型,您就可以充分利用 MDX 分析来应对更具挑战性的请求。

于 2013-08-15T22:52:31.003 回答