我想在 php 中创建一个简单的应用程序,在许多特定的搜索引擎上进行搜索并返回格式正确的结果。是否可以使用 Sphinx 作为元搜索引擎,还是太慢了?我不想索引 Mysql 数据库上的所有内容,但同时我不知道这种方法是否会非常消耗资源。我预计每天至少有 200000 个查询。
问问题
239 次
1 回答
1
并不真地。Sphinx 索引数据库中的数据。它设计用于索引相对静态数据。即变化不大的数据。然后对这些数据进行了广泛的质疑......
元搜索将联系多个搜索引擎,组合结果并显示。
你真的不需要一个“搜索引擎”(这就是 sphinx 是什么)来支持这个 - 实际的搜索发生在远程服务上。
组合所有数据只是一个数据操作项目。大部分工作将通过它们的 API(甚至是抓取)联系各种搜索引擎,然后获得一致的数据格式。显示结果相对简单。
(例外情况,如果您的“元搜索引擎”在本地缓存整个数据集,然后需要搜索它们。假设您下载了 wikipedia 转储、地名转储,然后想要搜索它们。Sphinx 将对此有所帮助。但它没有听起来那是你想要的。)
您可能希望它“集群”结果,即组合来自多个远程引擎的相似结果。Carrot2 是一个伟大的项目,几乎是理想的... http://project.carrot2.org/
于 2012-08-22T14:53:51.213 回答