我使用Lucene.net来索引网站上的内容和文档等。索引非常简单,格式如下:
LuceneId - Lucene 的唯一 id (TypeId + ItemId) TypeId - 文本类型(例如页面内容、产品、公共文档等) ItemId - 网页 id、文档 id 等。 文本 - 索引的文本 标题 - 与搜索结果一起显示的网页标题、文档名称等
我有这些选项来调整它以提供多语言内容:
- 为每种语言创建一个单独的索引。例如 Lucene-enGB、Lucene-frFR 等。
- 保留一个索引并向其添加一个额外的“语言”字段以过滤结果。
哪个是最好的选择 - 或者还有其他选择吗?我以前没有使用过多个索引,所以我倾向于第二个。