-1

(请耐心阅读)

我正在开发一个应用程序,它根据传递的关键字搜索 html 文档,例如:I want to buy a watchORA watch for sale等。我有大量包含这些关键字的 html 文档列表,但我目前面临的问题是我只想获取那些最匹配的文档与关键字。假设我正在尝试查找有关销售手表的帖子并尝试使用关键字:卖手表这应该带来最相关的帖子,该帖子实际上是在销售手表,而不仅仅是包含销售词和手表词

你可能会问我到目前为止做了什么:好吧,我已经用简单的 PHP 字符串搜索完成了文档的搜索,而这正是我不想做的。我喜欢自然搜索,任何第三方 API 或任何想法都会有很大帮助。

注意:我没有将文档保存在数据库中,我只是将它们从 Internet 拉到我的代码中,并使用关键字查找它们是否相关。

谢谢

4

1 回答 1

2

Zend_Search_Lucene 可能会帮助你。http://framework.zend.com/manual/1.12/en/zend.search.lucene.html

如果您有可能在您的服务器上安装搜索引擎,我会推荐SphinxElasticSearch

您还可以使用一些第 3 方搜索 SAAS,例如(无特定顺序):

http://www.indexden.com/

http://www.searchify.com/

http://www.found.no/

http://websolr.com/

https://swifttype.com/

https://searchbox.io/

http://www.houndsleuth.com/

http://www.bonsai.io/home

于 2013-08-07T09:53:22.463 回答