(请耐心阅读)
我正在开发一个应用程序,它根据传递的关键字搜索 html 文档,例如:I want to buy a watch
ORA watch for sale
等。我有大量包含这些关键字的 html 文档列表,但我目前面临的问题是我只想获取那些最匹配的文档与关键字。假设我正在尝试查找有关销售手表的帖子并尝试使用关键字:卖手表这应该带来最相关的帖子,该帖子实际上是在销售手表,而不仅仅是包含销售词和手表词
你可能会问我到目前为止做了什么:好吧,我已经用简单的 PHP 字符串搜索完成了文档的搜索,而这正是我不想做的。我喜欢自然搜索,任何第三方 API 或任何想法都会有很大帮助。
注意:我没有将文档保存在数据库中,我只是将它们从 Internet 拉到我的代码中,并使用关键字查找它们是否相关。
谢谢