0

在 hadoop 流中,有没有办法获取处理给定任务的节点的 ID?

通过类比,这个片段给出了任务的输入文件的名称:

#!/usr/bin/env python
import os
map_input_file = str(os.environ["map_input_file"])

我正在寻找类似 os.environ["map_node_id"] 的东西。该节点的任何唯一句柄都可以工作......

4

1 回答 1

1

您可以简单地通过使用映射器/减速器中的套接字模块来获取数据节点的主机名:

import socket
...
node = socket.gethostname()
于 2012-09-04T09:40:12.207 回答