0

我正在寻找建立一个房地产搜索引擎规格是大约 500 000 个列表,可能每天更新 50 000 个列表数据以干净(ish)CSV 提供 - 需要删除字符,编码 utf,通常。50 多个数据字段(30 张图片、各种属性规格等)

我对 Drupal7 有很多问题,而 Joomla 无法处理。那只是数据导入。

我想让 solr 索引数据并用作搜索引擎。我有几个问题。

  1. solr 可以直接从其索引中提供列表吗?(如果是这样,我需要一个数据存储,比如 Mysql 甚至是 CMS)
  2. 我最好将数据放在一个简单的单表 mysql DB 中并使用它将文档推送到 solr 以获取索引,然后从 DB 或从 Solr 索引加载列表。

由于数据困难,似乎我可以简单地消除许多复杂性,试图弄清楚 D7/Joomla/任何其他 cms 的内部工作原理,只需将一些简单的 php 文件作为前端。

我不需要任何花哨的外观,我打算为这个项目使用基本的 drupal 模板。

我需要速度和可靠性以及出色的搜索结果。

4

1 回答 1

2

恕我直言,应该可以专门为您的目的使用 SOLR。SOLR 50000 个列表的数量即使对于单个服务器来说也不是很多,但我建议每 10 小时 500000 次更新确实很多。因为您每小时将有大约 50000 次更新,这相当于每小时完整的重新索引。

我们的企业也使用 SOLR,大约有 40-120 个字段。40000 个项目确实需要大约 5 分钟才能完全索引。如果您想自动预热缓存,您可能需要为此添加几分钟。

据我所知,您的问题将是小的更新周期。如果您想每小时更新一次单个文档而不是全部 50000 个列表,那么您的 solr 不能使用缓存,或者您将不得不使用多个 solr 服务器。(也许对于 solr 4.0,您甚至可以考虑扩展您的 solr 服务器硬件,但我怀疑 3.x 会从中受益) 不使用缓存可能会导致搜索性能变慢,但并非必须如此。

由于 SOLR 提供动态字段功能,您可以为每个文档添加不同的结构。这应该符合您的各种属性要求。

于 2012-04-07T07:44:51.740 回答