我有一个逻辑问题,我实际上不知道如何克服它。我面临着几个产品提要,它们内部有各种字段,并且在所有数据提要中都没有标准化:upc、mpn、品牌名称、标题、描述。目前我正在通过 upc 映射产品,因为这是独特且非常容易的。问题来了,只有少数产品有这个字段,所以我正在考虑另一种组合来映射品牌名称和 mpn。我用它来避免被不同品牌的 mpn 映射,实际上是不同的产品。现在困难的部分来了:一个产品,例如一双鞋:即使它有不同的颜色,也有相同的mpn和品牌。在这些情况下,我通常没有 upc,所以我必须依靠 mpn 和品牌名称。颜色不是一个字段,所以我不能用它来进一步过滤。
产品看起来像:
Merchant1,Product1,MPN1,Brand1(绿色) Merchant1,Product2,MPN1,Brand1(红色) Merchant2,Product3,MPN1,Brand1(绿色) Merchant2,Product4,MPN1,Brand1(红色)
我知道我可以拒绝在同一个商家中进行映射,这样我就可以避免混合来自同一个商家的绿色和红色,但是我该怎么做才能将商家 1 的绿色与商家 2 的绿色相匹配。说绿色或红色的文本字段不是目前,这只是我在图片中看到的。
我不知道如何在这一切中找到一个逻辑,所以我可以相应地映射。