问题标签 [olap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
545 浏览

sql - 使用 ASSL 脚本部署/创建 Analysis Services 数据库

我正在尝试使用 ASSL 脚本部署为 Analysis Services 数据库。

我可以在管理工作室中使用“script as”创建脚本。但我不知道如何运行这个脚本?

0 投票
3 回答
301 浏览

sql-server - 帮助找出(接近)实时多维数据查询的方法

我有一个涉及许多相关表的系统。考虑一个标准的类别/产品/订单/客户/订单项目场景。有些表是自引用的(如类别)。这些表都不是特别大(大约 100k 行,估计规模约为 100 万行)。我需要考虑这些数据的很多维度,但必须以近乎实时的方式进行查询。我也不知道特定用户对哪些维度感兴趣——它可以是众多表格中的一个或多个标准。事情可以从

  1. 给我所有的夹克类别
  2. 给我上个月在纽约购买的夹克 -> 红色派克大衣类别的所有东西
  3. 给我所有不是在纽约购买的价值超过 100 美元的东西。

目前,我们有一个很长的 SP,它使用“级联数据”方法——我们逐个表,使用为该表指定的任何标准将所有内容过滤到一个临时表中。对于下一个表,我们将当前临时表连接到我们正在使用的任何表,并将一个新的过滤器集应用到一个新的临时表中。它可以工作,但可管理性和性能很慢。我需要更好的东西。

我需要一种新的方法来解决这个问题。显然需要 OLAP,可能使用星型模式。这可以实时工作吗?它可以配置为实时工作吗?我应该使用索引视图来创建一组非规范化表吗?我应该将其完全卸载到数据库之外吗?

仅供参考,我们正在使用 Sql Server。

0 投票
2 回答
3796 浏览

algorithm - 有人知道OLAP Internals吗?

我对数据库内部了解一些。我之前实际上已经实现了一个小型、简单的关系数据库引擎,使用磁盘上的 ISAM 结构和 BTree 索引以及所有类似的东西。这很有趣,而且很有教育意义。我知道我对仔细设计数据库模式和编写查询更加了解,因为我对 RDBMS 如何在幕后工作有了更多了解。

但是我对多维 OLAP 数据模型一无所知,而且我很难在互联网上找到任何有用的信息。

信息如何存储在磁盘上?多维数据集包含哪些数据结构?如果 MOLAP 模型不使用包含列和记录的表,那么……什么?尤其是在高维数据中,什么样的数据结构让 MOLAP 模型如此高效?MOLAP 实现是否使用类似于 RDBMS 索引的东西?

为什么 OLAP 服务器在处理即席查询方面表现得如此出色?在普通关系数据库中可能需要数小时才能处理的相同类型的聚合可以在 OLTP 多维数据集中以毫秒为单位进行处理。使这成为可能的模型的基本机制是什么?

0 投票
3 回答
10203 浏览

sql - 报告查询:加入多个事实表的最佳方式?

我正在开发一个报告系统,该系统允许用户任意查询一组事实表,并限制每个事实表的多个维度表。我编写了一个查询构建器类,它根据约束参数自动组装所有正确的连接和子查询,并且一切都按设计工作。

但是,我有一种感觉,我没有生成最有效的查询。在一组具有几百万条记录的表上,这些查询大约需要 10 秒才能运行,我希望将它们降低到不到一秒的范围内。我有一种感觉,如果我可以摆脱子查询,结果会更有效率。

我不会向您展示我的实际架构(这要复杂得多),而是向您展示一个类似的示例,该示例说明了这一点,而无需解释我的整个应用程序和数据模型。

想象一下,我有一个音乐会信息数据库,其中包含艺术家和场地。用户可以任意标记艺术家和场地。所以架构看起来像这样:

很简单。

现在假设我想查询数据库中今天一个月内发生的所有音乐会,所有带有“techno”和“长号”标签的艺术家,在带有“cheap-beer”和“great-mosh-pits”标签的音乐会上表演.

我能想出的最佳查询如下所示:

该查询有效,但我真的不喜欢拥有这些多个子查询。如果我可以完全使用 JOIN 逻辑来完成相同的逻辑,我感觉性能会大大提高。

在一个完美的世界里,我会使用一个真正的 OLAP 服务器。但是我的客户将部署到 MySQL 或 MSSQL 或 Postgres,我不能保证兼容的 OLAP 引擎将可用。所以我坚持使用带有星型模式的普通 RDBMS。

不要太在意这个例子的细节(我的真实应用程序与音乐无关,但它有多个事实表,与我在这里展示的那些有类似的关系)。在这个模型中,'artist_tag' 和 'venue_tag' 表用作事实表,而其他一切都是维度。

重要的是要注意,在这个例子中,如果我只允许用户限制单个艺术家标签或场地标签值,那么查询编写起来要简单得多。只有当我允许查询包含 AND 逻辑时,它才会变得非常棘手,需要多个不同的标签。

所以,我的问题是:您所知道的针对多个事实表编写有效查询的最佳技术是什么?

0 投票
0 回答
3346 浏览

sql-server-2005 - SQL Server 分析问题-我的多维数据集损坏,声称找不到存在的列

我正在尝试自己学习 SSAS,但无法理解我的立方体的问题。我有一个数据库项目,我想在其中对单个表进行报告。我知道这有点不寻常,但它是一个相对简单的模型,并且数据已经被规范化到那个表中。它有两列作为维度——拍卖结束时间和产品类型。有许多衡量标准,包括售出物品的数量和售价。在 SSAS 中设置多维数据集和维度并进行处理后,它工作正常,我可以浏览多维数据集。我可以从 SAS 或我制作的 SSRS 报告中浏览多维数据集。

但是,如果我稍后再回来,我将无法再更新多维数据集。支持多维数据集的表模式没有改变,尽管有新行。当我在 SSAS 中“处理多维数据集”时,出现此错误:

OLAP 存储引擎中的错误:找不到属性键:表:dbo_ScrapedAuction,列:Id,值:76878。 OLAP 存储引擎中的错误:由于找不到属性键,因此跳过了记录。属性:Id of Dimension:Scraped Auction from Database:SSAS,Cube:Ebay Scraper,度量组:Scraped Auction,分区:Scraped Auction,记录:2913。OLAP 存储引擎中的错误:由于遇到的错误数量,流程操作结束在处理过程中达到了定义的操作允许错误限制。OLAP 存储引擎中的错误:处理来自 SSAS 数据库的“Ebay Scraper”多维数据集的“Scraped Auction”度量组的“Scraped Auction”分区时发生错误。

肯定有一个表 [dbo].[ScrapedAuction],它仍然有 [Id] 列,并且表中有一行我可以用 Id 76878 查询。有谁知道我遇到了什么问题? 我通过重新创建立方体来解决这个问题......这不是生产系统的真正解决方案。

0 投票
1 回答
1077 浏览

sql-server - SQL Server Analysis Services 和 OLAP 开发人员指南

SqlBatman 的这篇文章描述了与我目前的客户类似的情况,实际上,这表明许多公司依赖大量报告,由于它们对性能的影响,这些报告已被转移到通宵处理。

我如何开始使用分析服务,特别是 OLAP 多维数据集来帮助我的客户?

0 投票
1 回答
1842 浏览

c# - 构建本地立方体

我需要为使用 Excel 的客户端构建一个本地 .cub 文件。

我已经收集了一些 VB 代码,但它失败了:

我已将其缩减为上面的代码,OLE DB error: OLE DB or ODBC error.当我尝试运行它时,我得到了一个神秘的 "。

对上述任何帮助或有关解决此问题的不同方法的建议,我将不胜感激。

0 投票
1 回答
1035 浏览

sql-server - 设置对 MSSQLServer 分析多维数据集的只读访问权限的正确方法是什么

人们似乎无法从多维数据集获取数据,除非我将服务器上的数据库权限设置为“完全控制”。在 Microsoft SQL Server Analysis Server 中授予对多维数据集(仅)读取访问权限的正确方法是什么

0 投票
1 回答
1050 浏览

sql-server - 在 SQL Server Analysis Services 中处理大型结果集

我有一个数据库,其中包含有关文章结构制造商的数据。这意味着一篇文章链接到 1 个制造商和 N 个结构节点(认为是文章分类节点)。

在很多条件下使用 T-SQL 查询文章目前太慢而无法用于电子商店,即使硬件良好且索引表正确。(应低于 1 秒)。现在我想知道通过 OLAP Cube 访问这些数据是否有意义。我已经开发了一个来获取聚合,例如:在节点 Y 下递归存在多少制造商 X 的文章?

这些聚合非常快,现在我想知道通过多维数据集检索整个文章结果集是否有意义。含义:给我递归地存在于节点 Y 下的制造商 X 的一篇文章 ID 。因为结果集可能非常大,查询需要更长的时间..

因此我的问题是,有没有办法处理 SSAS 中的大型结果集,或者这完全是我采取的错误方向?

0 投票
2 回答
988 浏览

olap - BI 与数据挖掘有何关联?

我对如何将 BI 与数据挖掘联系起来有点困惑。BI可以被称为数据挖掘的某种表现形式吗?

Microsoft Analysis Services 等 BI 工具与 Weka 等数据挖掘工具有何不同?

我猜BI涉及更多的数据报告和分析,其中数据经过某种聚合并以多维数据集的形式表示,但数据挖掘还涉及执行聚类的不同算法,不是吗?

任何指针?

干杯