0

我正在寻找运行 Solr 服务器来统一搜索公共网站的几个不同方面。首先,有几种语言环境(美国、爱尔兰、日本等)和几种类型的内容(论坛、常规网页、帮助页面、产品等)

我希望能够对单个语言环境执行搜索,但返回多种内容类型的结果,以便我可以将它们显示为选项卡式结果集。

可能的选项:

  • 每个区域设置一个核心,并使用同一索引中的字段区分内容类型。
  • 每种内容类型都有一个核心。
  • 每种内容类型/语言环境组合都有一个核心。
  • 一切的单核/单索引。

注意事项:

Solr wiki 提到多核开始在大约 1000 万个文档时提供性能提升,我认为我们可能远远低于此,即使考虑到所有语言环境和内容类型。但是,将所有数据粉碎到单个索引中的解决方案似乎有点混乱,并且可能难以分片/扩展。单核非常适合获得单个结果集,因为我不必跨核进行多重搜索。

任何使用过多核的人可以告诉我吗?

4

1 回答 1

1

看起来对这个问题有些兴趣,所以我想我会开始用我的一些发现来更新答案。

首先,按语言环境分离核心有一些真正的优势,因为它使每种语言都可以轻松拥有自己的停用词和设置。就我而言,我永远不会跨区域搜索,所以这是合乎逻辑的。此外,由于每个内核的索引大小更小,它可能会给我一些速度提升。

至于按核心划分内容类型,我还在尝试一种内容类型,所以我会在扩展时更新。

于 2011-01-07T20:13:06.717 回答