1

嗨,

我有以下问题。我有 2 个数据集,一个包含以下结构的数据:

A1 B2 C1 D1
A1 B2 C1 D3
A3 B1 C2 D2
etc

另一个包含这些对象的值:

A1=x
B2=y
C1=z
D1=q
etc

如何对数据进行分组,以便将 A1=x B2=y C1=z D1=q 放在一个地方来计算它们?

谢谢!

4

1 回答 1

1

如果第二个数据集很小,您可以将其放入分布式缓存中。

您可以在映射器中逐行读取第一个数据集,然后使用来自分布式缓存的输入来获取值,然后发出一个键值对,例如 <"A1=x B2=y C1=z D1=q" , 1>

于 2013-06-26T18:13:15.497 回答