2

我的办公桌上出现了一个具有一些有趣要求的新项目。我需要开发一个可搜索的企业目录,重点是根据任意搜索查询提供相关结果。业务可以是任何利基市场;没有一个领域比另一个领域更具代表性。

在搜索“搜索算法”或“内容相关性算法”之类的内容时,我得到的只是对 Google 的“上古之神的神秘算法”和 SEO 公司的引用。

MySQL的全文Match()功能的相关性值是否有它所需要的任务?我从未使用过它,但我肯定会做一些测试。此外,由于这将主要是一个人工编辑的目录,我可以假设我们可以添加加权因子,如标记和类别。将这些因素与 MySQL 的Match()相关性结合起来的好方法是什么?

我也对我在这里没有讨论过的想法持开放态度。

4

3 回答 3

2

有关基于信息检索的技术的示例,请查找TF-IDFBM25

对于基于机器学习的技术,从 MSR 中查找RankNet及其变体。

于 2010-10-23T04:07:56.560 回答
1

如果您有手动编辑的数据,请查看Oracle 文本搜索。在我之前的一个项目中,我们取得了一些不错的成绩。

我没有直接参与数据库设置,但我知道结果非常受欢迎。(在此之前,他们只有基于关键字的搜索)。

于 2010-10-22T12:25:12.297 回答
0

使用像Solr这样的搜索引擎来索引数据。您仍然可以使用 MySql 来保存数据,但要使用搜索引擎进行搜索。

于 2010-10-27T18:07:49.240 回答