我很好奇 hive 如何执行查询,特别是自定义 UDF。我有 4 个数据节点,因此在 4 个不同的虚拟机上有 4 个任务跟踪器。
数据节点上的数据是加密的,我的 UDF 会解密数据。我很好奇 hive 是如何执行这个 UDF 的,是不是:
1)每个任务跟踪器检索其数据节点上的任何数据,并将其解密并返回
2)作业跟踪器检索所有加密数据,然后将解密委托给所有 4 个任务跟踪器。
我希望我的问题很清楚...
我很好奇 hive 如何执行查询,特别是自定义 UDF。我有 4 个数据节点,因此在 4 个不同的虚拟机上有 4 个任务跟踪器。
数据节点上的数据是加密的,我的 UDF 会解密数据。我很好奇 hive 是如何执行这个 UDF 的,是不是:
1)每个任务跟踪器检索其数据节点上的任何数据,并将其解密并返回
2)作业跟踪器检索所有加密数据,然后将解密委托给所有 4 个任务跟踪器。
我希望我的问题很清楚...