我有两组数字(或字符串)的分组。每个组都有一些 ID(编号),并且相同的组在两个分组中可能有不同的 ID。我想对这两个分组执行某种差异,并且想知道是否有这样的算法可以使用:) 如果有可用的 map reduce 实现,它会更好。
这里有一些例子需要澄清,因为我不确定我的术语是否容易理解。假设有 1、2、3、4 和 5 5 个数字。
在 Grouping (1) 中,有两个组:
-
第 1 组有 1 和 2。
第 2 组有 3、4 和 5。
在 Grouping (2) 中,有三组:
-
第 1 组有 3 和 4。
第 2 组有 1 和 2。
第 3 组有 5。
然后差异工具应该识别来自 Grouping (1) 的 Group 1 和 Group 2 from Grouping (2) 是相同的,并且来自 Grouping (1) 的 Group 2 的元素 5 已经在 Grouping (2) 中作为一个新组或类似的东西那。