我们在尝试从多个商家 Feed 中折叠产品时遇到了类似的问题。我们所做的是根据他们的品牌(或制造商)+ sku 组合来折叠产品。
我们的数据非常混乱,所以我们必须做一些工作来规范品牌和 sku,以便产品很好地崩溃。我们有一个我们关心的品牌列表,并做一些工作将品牌从商家源映射到我们的品牌。例如,如果我们的系统中有一个“ACME”品牌,我们可能会将以下内容映射到该品牌:
A.C.M.E => ACME
ACME Inc. => ACME
Acme Incorporated => ACME
对于 skus,我们通常只删除任何非字母数字字符以进行匹配。例如,以下所有内容都将映射到同一个 sku:
abc-123 => abc123
abc.123 => abc123
abc 123 => abc123
ab.c1.23 => abc123
因此,如果我们看到品牌“ACME Inc.” 和 sku“abc-123”在一个提要中,将与品牌“ACME”和另一个提要中的 sku“abc 123”一起折叠。
作为折叠过程的一部分,我们最终会为每个折叠的部分提供多个名称/图像/描述/类别/等等,并且需要选择“最佳”的部分以显示在网站上。
这是我们如何处理它的一个非常高级的概述。