3

我正在开发一个小型价格/产品比较网站,它是一个与笔记本电脑和平板电脑相关的利基网站,内置 php。

我的问题/问题是如何执行以下操作:“匹配来自不同商家的类似产品”。我的意思是,当产品有 EAN/ISBN 时,一个简单的 %LIKE% 就可以做到。但是我得到的数据馈送中有很多产品缺少 ean 或任何其他唯一 ID。比价网站如何处理这个问题?

我正在考虑搜索产品名称之间的字符串相似性,但我不想匹配: Acer iconia tab a500

acer iconia tab a500 机箱为同类产品。有任何想法吗?

谢谢 !

4

2 回答 2

1

要进行比较,您必须为产品添加一些标签。当人们搜索产品时,列出具有相同标签的其他产品。

例如:对于笔记本电脑,标签如笔记本电脑、宏碁、14 英寸、500 美元(价格)等。

因此,当有人搜索笔记本电脑时,请列出所有笔记本电脑。这样他就可以选择其中的两个。并进行比较。

希望你明白这个概念。

于 2012-04-15T13:24:24.317 回答
0

我遇到了类似的问题。有不同的解决方案。

您可以使用一些搜索技术(全文搜索引擎可能会有所帮助)或使用一些数据挖掘方法(查看用于识别品牌、型号、颜色等的命名实体识别,尤其是机器学习方法文本挖掘)。如果你做得好,后者会更准确。

在这两种方法中,您可以使用一些额外的模糊逻辑来比较可以以不同方式编写的单词的字符串。以及消除错误项目的一般预定义规则。例如,考虑到价格可以区分物品及其配件,尽管它们的标题非常相似。

于 2013-05-21T14:26:15.740 回答