我正在寻找一个用于处理网站上的搜索请求的具体代理。代理需要能够处理简单的问题,并提供一系列网站链接以获得答案。
所有文章都在数据库中。每篇文章都有一个标题字段,以及一系列用于对文章进行分类的标签。
在这一点上,我的简单算法是:
- 将问题分成一系列单词。
- 删除所有常用词,如“a”、“the”、“how”等。
- 创建一个“where”子句,在文章正文、文章标题和标签中搜索剩余的单词。
- 显示列表,可能与标题匹配的文章排名第一,标签第二,文章正文第三。
有没有更好的算法将英语问题转换为 SQL 查询?文章作者是否应该跟踪每篇文章的具体细节以进一步改善搜索结果?在使用搜索时是否应记录一些详细信息以进一步改进搜索结果?
更新: 该网站将使用最新的 ASP.NET 在 IIS 上运行。后端数据库将是 SQL Server。