0

我正在尝试优化 solr。

solr>collection1 附带的默认 solrConfig 包含很多我并不真正需要的库。也许如果有人可以帮助我们确定目的。(我只从 DIH 导入):

请告诉我这些是什么:

contrib/extraction/lib
solr-cell-

contrib/clustering/lib
solr-clustering-

contrib/langid/lib/
solr-langid
4

1 回答 1

1

贡献/提取/lib
solr-cell-*

这些是与 Tika 集成的Solr 细胞库,可帮助您索引丰富的文档,例如 Microsoft Word、Excel 等。

contrib/clustering/lib
solr-clustering-

Solr 集群用于与 Carrot 集成的集群支持。聚类将帮助您对文档、主题、实体提取等进行分组。

contrib/langid/lib/
solr-langid

Solr Language I d 用于语言检测。它增加了在索引之前检测文档语言的能力,然后对分析等做出适当的决定。

如果您不使用上述任何功能,只需排除 jars,并确保您也从 Solr 配置文件中删除了映射。

于 2013-06-05T11:49:21.907 回答