有哪些方法可以在 Hadoop 中查找 X 数据范围,以便可以在 reducer 步骤中将这些范围用作分区?
问问题
95 次
1 回答
0
看起来你需要像TotalOrderPartitioner这样的东西,它允许通过从外部生成的源读取拆分点来进行总订单。您可能会发现此链接很有用: http ://chasebradford.wordpress.com/2010/12/12/reusable-total-order-sorting-in-hadoop/ 。
不知道这是否正是您所需要的?抱歉,如果我弄错了。
于 2013-06-19T19:49:47.590 回答