我已经问了一些关于提高 Hive 查询性能的问题。一些答案与映射器和减速器的数量有关。我尝试了多个映射器和减速器,但我没有看到执行中有任何区别。不知道为什么,可能是我没有以正确的方式做到这一点,或者我错过了其他东西。
我想知道是否可以并行执行 Hive 查询?我的意思是,通常查询会在队列中执行。例如:查询1
查询2
查询3
. . . n
执行时间太长,我想减少执行时间。
我需要知道如果我们在 Hive JDBC 程序中使用 mapreduce 程序,那么是否可以并行执行它?不知道这是否可行,但这是我的目标?
我在下面恢复我的问题:
1)如果可以并行运行多个 Hive 查询,是否需要多个 Hive Thrift Server?
2) 是否可以打开多个 Hive Thrift 服务器?
3) 我认为不可能在同一个端口上打开多个 Hive Thrift Server?
4) 我们可以在不同的端口上打开多个 Hive Thrift Server 吗?
请为此建议我一些解决方案。如果您有其他选择,我也会尝试。