1

我在我的 Ruby on Rails 项目中配置了 Sunspot/Solr,它运行良好。因此,它的响应时间很棒,它可以快速找到记录。

但是我有两个问题/问题无法解决,也找不到任何信息或解释。

a) 我想知道如何更改引擎行为,例如当我搜索“windows”时,我可以找到包含该词的所有记录。但是,如果我搜索“窗口”,则不会返回任何记录。有没有办法改变任何参数来改变这种行为?

b)我想知道如果我实现了一些文件上传脚本或实用程序,我将能够索引这些相关文件,我的意思是,如果我上传附加到记录的 PDF(使用 ActiveRecord)。Solr/Sunspot 是否能够索引并找到它。

问候。

4

1 回答 1

0

我可以从 Solr 角度提供答案,检查您是否可以将其映射到 Sunspot api 中:-

  1. 对于窗口和窗口搜索,您需要在您的字段上启用词干提取。词干会减少单词的词根,并允许您始终将结果与词根匹配。检查如何向 Sunspot 中定义的字段添加过滤器,或者您可以在配置了词干过滤器的 schema.xml 中定义文本字段。

  2. Solr提取处理程序提供了使用丰富文档和解析内容的能力。Solr 使用 apache Tika 底层,可以解析大部分富文档格式。只需在 Sunspot 中检查匹配的 api。我知道 Solrj 为此提供了一个简单的 api。

于 2013-02-17T10:33:23.370 回答