1

我正在尝试为我正在制作的网站编写预测搜索系统。

完成的功能将很像这样:

在此处输入图像描述

我不确定做到这一点的最佳方法,但这是我目前所拥有的:

搜索表:
id - term - count

每次进行搜索时,都会将其插入到搜索表中。


当用户在搜索输入中输入字符时,会发生以下情况:

  1. 页面向搜索 PHP 文件发出 AJAX 请求
  2. PHP 文件连接到 MySQL 数据库并执行查询:SELECT * FROM searches WHERE term LIKE 'x%' AND count >= 10 ORDER BY count DESC LIMIT 10(x = 搜索输入中的文本)
  3. 然后在页面上列出基于过去搜索条件的 10 个最佳结果

这个解决方案远非完美。如果任何随机人搜索相同的词 10 次,那么它将显示为推荐搜索(如果有人在哪里搜索以相同字符开头的词)。我的意思是,如果有人搜索“poo poo”10 次,然后有人在网站上搜索“po”来寻找土豆,他们会认为“poo poo”是一个热门搜索。这不酷

解决这个问题的一些想法确实浮现在我的脑海中。例如,我可以将搜索表中的每个插入查询限制为用户的 IP 地址。但是,这并不能完全解决问题,如果用户有一个动态 IP 地址,他们可以重新启动调制解调器并对每个 IP 地址执行 10 次搜索。当然,它必须输入的次数可能仍然是一个秘密,所以它更安全一些。

我想另一种解决方案是添加一个黑名单以删除“poo poo”之类的词出现。

我的问题是,有没有更好的方法来做到这一点,或者我是否沿着正确的路线前进?我想编写允许它扩大规模的代码。

谢谢

4

2 回答 2

2

你在正确的轨道上。

我会做什么:

  1. 您唯一地存储每个查询。为该搜索词添加一个跟踪每个 IP 的表,并且每个 IP 只更新一次计数
  2. 如果某个新/唯一关键字在 X 段时间内被计数超过 X 次,请让您的系统向您/您的管理员发送邮件,以便您有机会手动将他们的关键字列入黑名单。这必须手动进行,因为一些热门话题也可能显示此行为。
  3. 这是最有趣的一个:一旦查询完成,检查结果的数量。建议没有结果的关键字是没有意义的。所以只建议至少会给出 X 数量结果的查询。像“poo poo”这样的查询不会给出任何结果,因此它们不会出现在您的建议列表中。

我希望这有帮助。如果您有任何问题,请在聊天中进一步与我交谈 :)

于 2013-10-24T13:22:20.210 回答
0

例如,您可以添加一个名为 validate 的新布尔列,并避免使用黑名单。如果 validate 为 false,则不会出现在推荐列表中

该字段可以由管理员手动调整(通过查询或后台工具)。您可以添加另一个名为 audit 的列,它存储查询的时间戳。如果最大和最小时间戳之间的差异超过一个值,则默认情况下验证字段可能为 false。

该解决方案可以轻松快速地开发您的想法。

问候和祝你好运。

于 2013-10-24T13:08:33.560 回答