我正在尝试优化 solr。
solr>collection1 附带的默认 solrConfig 包含很多我并不真正需要的库。也许如果有人可以帮助我们确定目的。(我只从 DIH 导入):
请告诉我这些是什么:
contrib/extraction/lib
solr-cell-
contrib/clustering/lib
solr-clustering-
contrib/langid/lib/
solr-langid
贡献/提取/lib
solr-cell-*
这些是与 Tika 集成的Solr 细胞库,可帮助您索引丰富的文档,例如 Microsoft Word、Excel 等。
contrib/clustering/lib
solr-clustering-
Solr 集群用于与 Carrot 集成的集群支持。聚类将帮助您对文档、主题、实体提取等进行分组。
contrib/langid/lib/
solr-langid
Solr Language I d 用于语言检测。它增加了在索引之前检测文档语言的能力,然后对分析等做出适当的决定。
如果您不使用上述任何功能,只需排除 jars,并确保您也从 Solr 配置文件中删除了映射。