我对Hadoop很陌生,我目前正在尝试加入两个数据源,其中键是一个间隔(比如 [date-begin/date-end])。例如:
输入1:
20091001-20091002 A
20091011-20091104 B
20080111-20091103 C
(...)
输入2:
20090902-20091003 D
20081015-20091204 E
20040011-20050101 F
(...)
我想找到key1与key2重叠的所有记录。hadoop 可以吗?我在哪里可以找到实施示例?
谢谢。