我在我的网站上展示了大量的产品。我必须对来自不同网站的类似产品进行分组,这些产品已经爬入我的数据库。因此,当搜索产品时,它也会显示来自另一个网站的相同产品。
我尝试了以下方法
按产品名称分组
结果 - 失败,因为 Sony Xperia Z, Sony Xperia Z( black ) 是同一个产品,但标题不同,所以不能在同一个组。所以错误率非常高。
按属性分组:
具有相似属性和价值的产品被归为一组。但它的速度很慢,错误率也很高。由于来自不同公司的不同产品可能具有相同的属性。
这是最好的方法。请帮帮我。
在此先感谢。抱歉英语不好。