0

这是一个笼统的问题,我希望它会以正确的精神来对待。我是 solr 的菜鸟,试图用它构建我的第一个应用程序。我想确认我考虑过的方法,请随时提出增减建议:

1) DIH - 找出要索引的所有数据,这应该包括要查询的数据和元数据(如果有的话)。弄清楚每个数据的易失性以及 cron 任务将如何更新和删除这些数据。围绕这些知识制定增量/部分导入策略。

2) Schema - 排列数据。还要在需要的地方安排元数据。在需要的地方使用分析器进行处理,在适用的地方设置查询分析器。

3) 查询调优——开始测试样本数据,进一步微调应用程序。

4)添加同义词并测试相同。

5) 刻面

6) 搜索框 (ajax) 中的建议仅适用于索引项目。

4

1 回答 1

2

如果您刚开始,您可能应该只关注基本索引并获取可搜索的数据。

  • 从 Solr 的独立设置开始。
  • 数据索引 - 取决于您拥有的数据。DB (DIH), Rich Documents (Extratc Handler), Web pages (With Nutch) ...
  • Schema.xml 的配置
    • 需要配置哪些字段
    • 什么目的(显示、搜索、构面、突出显示......)
    • 您想对这些字段进行什么分析?
    • 您可以逐步应用停用词、ascii 过滤器、词干分析器、同义词。
  • solrconfig.xml 的配置
    • 您希望搜索的行为方式。
    • 您希望搜索哪些字段?多个领域?
    • 您想使用什么解析器进行搜索 Standard ?迪斯马克斯?EDismax ?
  • 如果正确配置并且只需要正确创建查询,则会在字段上启用分面、过滤、排序和突出显示

  • 先进的 :-

    • 搜索相关性调整
    • Solr 设置 - 高级,您可以检查是否需要多核步骤、主/从配置、分布式搜索、Solr Cloud
    • 索引时间性能调优
    • 查询时性能调优
    • Autosuggestions,你的意思是和其他功能可从 solr 获得,或者可以从应用程序端轻松构建。
于 2012-12-05T07:01:43.667 回答