Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
嗨,
我有以下问题。我有 2 个数据集,一个包含以下结构的数据:
A1 B2 C1 D1 A1 B2 C1 D3 A3 B1 C2 D2 etc
另一个包含这些对象的值:
A1=x B2=y C1=z D1=q etc
如何对数据进行分组,以便将 A1=x B2=y C1=z D1=q 放在一个地方来计算它们?
谢谢!
如果第二个数据集很小,您可以将其放入分布式缓存中。
您可以在映射器中逐行读取第一个数据集,然后使用来自分布式缓存的输入来获取值,然后发出一个键值对,例如 <"A1=x B2=y C1=z D1=q" , 1>