问题标签 [olap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
1524 浏览

database - 简单的 MOLAP 解决方案

为了分析大量文本日志,我做了一些看起来像这样的黑客操作:

  1. 将日志本地导入 Access
  2. 重新处理 Cube 链接到 Analisis Service 2000 中以前的 mdb(是的,它是 2k)
  3. 使用 Excel 可视化 Cube(它并不大 - 多达数百万个原始条目)

我的黑客是成功的,越来越多的人要求访问我的工具。如您所见,我看到了更多的自动化和更容易的部署。

您现在是否有一些工具/库可以给我同样的但更容易部署?一种嵌入式 OLAP服务?

编辑:我听说过蒙德里安,但我们对 Java 做的不多。你见过为 .Net/Win32 做过类似的事情吗?商业也行。

0 投票
3 回答
3023 浏览

sql-server - 在 SSAS 中处理多维数据集期间没有跟踪信息

当我在 Visual Studio 2005 中处理多维数据集时,我收到以下消息:

处理成功。跟踪信息仍在传输中。如果您不想等待所有信息到达,请按停止。

并且不显示任何跟踪信息。多维数据集被它处理好有点烦人。有任何想法吗?我通过网络服务器访问多维数据集。

0 投票
10 回答
24939 浏览

ssas - 如何学习 MDX

经过多年的关系数据库开发,我目前正在学习 OLAP 和 MDX。

关于 MDX 入门的任何提示?学习 MDX 的最佳书籍和资源是什么?

0 投票
4 回答
4392 浏览

database-design - 如果分析多维立方体 (OLAP) 会怎样

我有一个具有多个维度的多维 OLAP 多维数据集。其中一些维度具有层次结构。用户希望通过更改维度中的层次结构对多维数据集中的度量执行“假设”分析。

例如,他们想知道部门之间的员工调动对部门资源预算的影响,或者产品从一个工厂转移到另一个工厂时制造成本的变化。

有没有人在现代 OLAP 引擎中有直接的方法来做到这一点?

0 投票
6 回答
2720 浏览

oracle - 模拟 OLAP

我们有一个使用 Oracle Standard的客户,以及一个使用 OLAP 可以轻松解决十倍的项目。但是,Oracle 仅在企业版中支持 OLAP 。

无法迁移到企业

我正在考虑对 OLAP 进行一些手动模拟,创建关系表来模拟该技术。

你知道我可以用其他方法吗?也许是 OLAP 的开源工具?有任何想法吗?

0 投票
7 回答
6857 浏览

sql-server - 为最终用户提供更简单的 SQL Server 分析服务多维数据集界面

是否有更简单的界面供最终用户在预先存在的 SqlServer 分析服务多维数据集上运行“查询”?我正在寻找一种方法来部署多维数据集并允许用户通过比 BIDS 更简单的界面来处理数据。这甚至可能吗?

0 投票
10 回答
6590 浏览

python - 为什么 SQL 聚合函数比 Python 和 Java(或可怜人的 OLAP)慢得多

我需要一个真正的 DBA 的意见。Postgres 8.3 在我的 Macbook Pro 上执行此查询需要 200 毫秒,而 Java 和 Python 在 20 毫秒(350,000 行)内执行相同的计算:

这是使用 SQL 数据库时的正常行为吗?

架构(该表包含对调查的回复):

我在 Java 和 Python 中为上下文编写了一些测试,它们粉碎了 SQL(纯 python 除外):

即使 sqlite3 与 Postgres 竞争,尽管它假设所有列都是字符串(相比之下:即使在 Postgres 中仅使用切换到数字列而不是整数也会导致 10 倍的减速)

我尝试过但没有成功的调整包括(盲目地遵循一些网络建议):

所以我的问题是,我在这里的体验是否正常,这就是我在使用 SQL 数据库时可以期待的吗?我可以理解 ACID 必须付出代价,但在我看来这有点疯狂。我不是要求实时游戏速度,但由于 Java 可以在 20 毫秒内处理数百万次双打,我感到有点嫉妒。

有没有更好的方法以便宜的方式进行简单的 OLAP(无论是在资金方面还是在服务器复杂性方面)?我研究过 Mondrian 和 Pig + Hadoop,但对维护另一个服务器应用程序并不太兴奋,也不确定它们是否会有所帮助。


没有 Python 代码和 Java 代码可以说是在内部完成所有工作。我只生成了 4 个数组,每个数组有 350,000 个随机值,然后取平均值。我不包括时间中的生成,只包括平均步骤。java 线程计时使用 4 个线程(每个数组平均一个),过大但绝对是最快的。

sqlite3 计时由 Python 程序驱动,并从磁盘运行(不是:内存:)

我意识到 Postgres 在幕后做了更多工作,但大部分工作对我来说并不重要,因为这是只读数据。

Postgres 查询不会更改后续运行的时间。

我重新运行了 Python 测试,包括将其从磁盘中脱机。时间大大减慢到近 4 秒。但我猜 Python 的文件处理代码几乎是用 C 语言编写的(尽管可能不是 csv lib?)所以这向我表明 Postgres 也没有从磁盘流式传输(或者你是正确的,我应该低头在谁写了他们的存储层之前!)

0 投票
3 回答
3044 浏览

excel - 以编程方式排除 olap pivot 中的页面项目

我在 olap 多维数据集上有一个数据透视表。我可以进入页面字段并手动取消选择多个项目。如何根据需要排除的项目列表在 VBA 中执行此操作?(注意我没有相应的我需要的物品清单)

我知道如何以其他方式排除这些项目,例如通过更改基础查询。我特别想复制取消选择数据透视中项目的用户操作。

0 投票
1 回答
3121 浏览

olap - 如何在 MDX 中将级别的总和显示为其最后一个子级的值

我有一个 MDX 查询,它列出了 OLAP 数据库中所有“周”和“日”级别的度量。例如

但是,在显示一周的度量值的地方,我不想显示所有 Day 值的总和,而是想显示一周内最后一天的值。例如

第 1 周:12
日 9 月 15 日:10
9 月 16 日:20
9 月 17 日:12
日 9 月 18 日:15
9 月 19 日:8 9 月
20 日:9
日 9 月 21 日:12
第 2 周:15
9 月 22 日:12
9 月 23 日:15

如何在 MDX 中实现这一点?

0 投票
4 回答
2329 浏览

reporting-services - SSAS 中的自定义 ROLAP 数据源

我正在尝试从一堆二进制文件构建 OLAP 数据源,而我们当前的模型无法正常工作。我们使用 SSAS 作为结果的分析/报告模型,但无法从 SQL 中获得我们想要的性能。

我们的主要限制是:

  1. 数据库非常大。我们有数百万行的巨大维度表和几个较小的事实表(<1,000,000 行)。

  2. 我们有一个动态多维数据集。B/C 事实表是动态构建的,并且通常(可能每天多次),在设置多维数据集时不会有任何巨大的开销。当前在多维数据集上的部署时间可能超过 24 小时,我们需要将性能提高几个数量级,而硬件无法提供给我们。

基本上,我们想要一个快速的设置和部署,它本身并不适合使用 SQL Server 2005 的 SSAS,但是我们想要使用 SSRS 进行报告,并且我们想要一个 OLAP 模型在 Excel 中进行分析,所以我们仍然想如果可能,使用 SSAS 构建多维数据集。

SSAS 中用于快速部署的常见解决方案是 ROLAP,但我们会在较大的 ROLAP 查询中遇到执行错误,而且我们也不喜欢将二进制数据转换为 SQL 并将其加载到多维数据集中所涉及的所有开销。

有没有人在 SSAS 可以使用的自定义 OLAP 数据源上做过工作?我们正在寻求创建我们自己的 ROLAP 引擎,它将直接查询二进制源文件。