0

我有一个逻辑问题,我实际上不知道如何克服它。我面临着几个产品提要,它们内部有各种字段,并且在所有数据提要中都没有标准化:upc、mpn、品牌名称、标题、描述。目前我正在通过 upc 映射产品,因为这是独特且非常容易的。问题来了,只有少数产品有这个字段,所以我正在考虑另一种组合来映射品牌名称和 mpn。我用它来避免被不同品牌的 mpn 映射,实际上是不同的产品。现在困难的部分来了:一个产品,例如一双鞋:即使它有不同的颜色,也有相同的mpn和品牌。在这些情况下,我通常没有 upc,所以我必须依靠 mpn 和品牌名称。颜色不是一个字段,所以我不能用它来进一步过滤。

产品看起来像:

Merchant1,Product1,MPN1,Brand1(绿色) Merchant1,Product2,MPN1,Brand1(红色) Merchant2,Product3,MPN1,Brand1(绿色) Merchant2,Product4,MPN1,Brand1(红色)

我知道我可以拒绝在同一个商家中进行映射,这样我就可以避免混合来自同一个商家的绿色和红色,但是我该怎么做才能将商家 1 的绿色与商家 2 的绿色相匹配。说绿色或红色的文本字段不是目前,这只是我在图片中看到的。

我不知道如何在这一切中找到一个逻辑,所以我可以相应地映射。

4

1 回答 1

0

当您有 Merchant1,Product1,MPN1,Brand1(绿色) Merchant1,Product2,MPN1,Brand1(红色)等 2 个产品时,您知道图像文件名吗?因为如果您知道可以读取此文件名,则可以将所有信息(例如 Merchant1、Product1、MPN1、Brand1+imageFileName)连接起来,然后使用 md5 函数生成代码……您可以将其与每个产品一起存储……当您必须存储一个新的,您可以检查您的数据库中是否已经有该 md5 代码

于 2016-08-10T15:53:19.303 回答