0

有人可以解释SAP HANA 和SAP HANA Vora的智能数据访问之间的区别吗?

据我了解,SDA只是创建了一些virtual tables能够访问外部系统(如 Hadoop 和许多其他数据库的 ODBC 数据库)的数据,就像它是 SAP HANA 系统的一部分(因此您可以使用 HANA IDE)并使用“默认数据库引擎”计算此外部系统的子结果并将其返回给 SAP HANA。

Vora的概念也是让 SAP 用户访问 Hadoop 系统,但子结果是使用 Apache Spark 的 InMemory 执行引擎计算的。

我读到 Hadoop 是冷数据(来自 SAP HANA 的数据早于某个时间段,并非所有分析都需要的数据)的完美数据存储。但是我对这两种数据访问解决方案感到困惑,因为我找不到重要的区别。

如果您计划在由 SAP HANA 工具编写的一次分析中访问热 (SAP HANA) 和冷 (Hadoop) 数据,哪一个会更好?

对于将 SAP HANA 和包含 Hive 表中的数据的 Hadoop 集群结合起来,您有什么建议?

4

1 回答 1

2

HANA Vora 和 SDA 是相关的,但实际上是两个不同的东西,不能直接比较。

智能数据访问是 HANA 中的一个功能/组件,用于连接外部数据源(例如 MySQL/Oracle 数据库、Vora 等)

“HANA Vora”中的HANA这个词具有误导性,因为Vora实际上是一个独立的产品,不需要HANA来运行。Vora 是 Apache Spark 的扩展,允许您在内存中处理来自 HDFS 的数据。此外,Vora 的关键特性之一是它与 HANA 很好地集成。它可以将其本地表与来自 HANA 的表连接起来,反之亦然。

目前 Vora 不支持 INSERT/UPDATE 命令,因此您不能直接将用于冷数据存储的数据从 HANA 移动到 Vora。但是,您可以通过使用本博文中讨论的 HANA 的数据生命周期管理器 (DLM) 来实现这一点:https ://blogs.sap.com/2016/02/12/seamless-big-data-tiering-with-hana-hadoop -and-vora-with-a-little-help-from-dlm/

于 2017-03-08T23:26:22.460 回答