据我所知,我知道 OLAP 用于 Power Pivot 以加快与数据的交互。
但我知道像 Google BigQuery 和 Amazon RedShift 这样的大数据数据库是在过去几年出现的。像 Looker 和 Chart.io 这样的面向 SQL 的 BI 解决方案是使用 OLAP 还是依赖于数据库的速度?
据我所知,我知道 OLAP 用于 Power Pivot 以加快与数据的交互。
但我知道像 Google BigQuery 和 Amazon RedShift 这样的大数据数据库是在过去几年出现的。像 Looker 和 Chart.io 这样的面向 SQL 的 BI 解决方案是使用 OLAP 还是依赖于数据库的速度?
那要看。我有一些 BI 解决方案的经验(例如,我们使用 Tableau),它可以操作是两种主要模式:它可以对您的服务器执行查询,或者可以收集相关数据并将其存储在用户的机器上(或在安装应用程序的服务器上)。在处理大量数据时,我们过去常常让 Tableau 查询 SQL Server 本身,这是因为我们的 SQL Server 机器与我们拥有的其他机器相比非常强大。
无论如何,即使您将数据存储在本地并想要“刷新”它,当它更新数据时它需要从数据库中检索它,这有时也可能是一项昂贵的操作(取决于您的数据的构建方式和组织)。
您还应该注意到,您比较了 2 个不同的产品系列:虽然 Google BigQuery 和 Amazon 的 RedShift 实际上是用于存储数据和查询数据的数据库引擎,但大多数 BI 和报告解决方案更关注查询数据和可视化因此(一般来说)它不太关注拥有智能内部数据库(至少从我的经验来看)。
Looker 依赖于数据库的速度,但确实对数据进行建模以帮助提高速度。Mode 和 Periscope 与此类似。不确定 Chartio。
OLAP 用于组织数据以帮助提高查询速度。虽然 Power Pivot 和 Pentaho 等许多 BI 产品都在使用它们,但有几家公司已经建立了自己的数据组织方式来帮助提高查询速度。有时这包括将数据存储在他们自己的数据结构中以组织数据。Birst、Domo 和 Gooddata 等许多云 BI 公司都这样做。
Looker 创建了一种称为LookML的建模语言来对存储在数据存储中的数据进行建模。由于现在数据库比创建 OLAP 时更快,Looker 采用直接连接到数据存储(Redshift、BigQuery、Snowflake、MySQL 等)的方法来查询数据。LookML 模型允许用户与数据交互,然后运行查询以在表格或可视化中获取结果。