我已经扩展了InputSplit
Hadoop 的类来计算我的自定义输入拆分,但是当我返回一个特定的 HostIP(即数据节点 IP)作为覆盖的getLocations()的字符串时,它的 Map Task 并没有在该 HostIP 上执行,而是它正在执行在其他一些上。不在该特定 HostIP 上执行会出现什么问题?
问问题
55 次
我已经扩展了InputSplit
Hadoop 的类来计算我的自定义输入拆分,但是当我返回一个特定的 HostIP(即数据节点 IP)作为覆盖的getLocations()的字符串时,它的 Map Task 并没有在该 HostIP 上执行,而是它正在执行在其他一些上。不在该特定 HostIP 上执行会出现什么问题?