0

我有一个高流量的新闻网站,我需要添加一个搜索功能。我需要免费或便宜的东西,可以立即将新的新闻故事添加到搜索结果中,处理高流量,并允许自定义结果样式。我查看了 Google 自定义搜索,它似乎不是一个好的选择,因为您必须为高流量付费,而且他们不会立即添加新的新闻文章,除非我每次添加文章时都付费为它们编制索引。

有谁知道可以满足我需要的不同搜索 API 或者更好的,我可以使用的某种库或脚本?例如,Sphinx、Lucene、Solr 等是否具有索引网页的能力?如果是这样,这是否有大量的数据需求,会使我的 Amazon Web Services 账单飙升?最好的解决方案是什么?

4

1 回答 1

1

如果它们都只是一堆文本文件,您可以使用带有附件插件的elasticsearch来索引这些文本文件。

但是,请注意,这不是简单的即插即用情况。您将需要编写一些代码来获取这些文本文件,然后将其索引到弹性搜索中。

您还必须编写一些代码,以便每次更新或添加页面时,都会调用 elasticsearch 的 web 服务以对其进行索引或更新。

Elasticsearch 使用 REST API,因此您可以使用 CURL 轻松地与它进行交互,就像任何普通的 Web 服务一样。还有一些 PHP 库可以简化交互。数据以 JSON 格式发送和接收。

我认为弹性搜索在这里会很合适,但试一试,看看它是如何工作的。

于 2012-07-05T03:49:21.170 回答