当我们运行 Hive 查询时,我试图了解各种 id 之间的关系。我正在考虑以下场景,建议用于真实集群。
ClientMachine
---连接/ssh--> GatewayNode
(比如user1,serverA)---> HiveServer2( ServerB
---> Driver
--> Remote MetaData Service (serverC)
-->MySql (serverD)
实际数据存储在 中HDFS
,可以有自己的一组用户。
现在,我的疑问是,我们每一层都有不同的用户,例如 MySQL DB、HDFS、HiveServer2 等;因此,如果我以 user1 身份登录 GatewayNode 并且该用户 ID 不在 HDFS 或 MySql 中,那么这种情况如何工作?
任何人都可以帮助理解这一点吗?