我试图hive
从体系结构的角度来理解,我指的是 Tom White 关于 Hadoop 的书。
关于蜂巢,我遇到了以下术语:Hive Services
, hiveserver2
,metastore
等等。
参考书中的下图(Hadoop:权威指南)。
蜂巢架构:
元存储配置:
Hive 架构显示了“驱动程序”是什么:
我无法理解以下内容:
1) Hive Services
Hive 架构图中的内容是什么?当我们说的时候是一样的hiveserver2
吗?
2) Driver
Hive 架构图中是什么?
3)什么是MetaStore
(我不是指 Metastore 数据库)。是某个运行的进程吗?如果是这样,这是否属于hiveserver2
? 根据图表MetaStore
可以是远程的,那么如果这是一个 JVM 进程,它属于哪个组件?
4)它说Hive service JVM
,MetaStore JVM Server
。但是,这些组件安装在哪里?它们是“蜂巢”的“服务器”端的一部分吗?
5)在“Hive Architecture”图中,它说“Hive Server”?这是什么?这就是我们所说的“Hive Server 1”,“Hive Server2”。
任何人都可以帮助理解这一点吗?