所有,我正在尝试在 Solr 5.3.1 中应用拼写检查。
目前 Solr 5.3.1 已经包含SpellCheckComponent
. 如下所示。
<searchComponent name="spellcheck" class="solr.SpellCheckComponent">
<str name="queryAnalyzerFieldType">text_general</str>
<lst name="spellchecker">
<str name="name">default</str>
<str name="field">text</str>
<str name="classname">solr.DirectSolrSpellChecker</str>
<str name="distanceMeasure">internal</str>
<float name="accuracy">0.5</float>
<int name="maxEdits">2</int>
<int name="minPrefix">1</int>
<int name="maxInspections">5</int>
<int name="minQueryLength">4</int>
<float name="maxQueryFrequency">0.01</float>
</lst>
<lst name="spellchecker">
<str name="name">wordbreak</str>
<str name="classname">solr.WordBreakSolrSpellChecker</str>
<str name="field">name</str>
<str name="combineWords">true</str>
<str name="breakWords">true</str>
<int name="maxChanges">10</int>
</lst>
</searchComponent>
但是当我尝试使用此功能时。像这样。
http://10.2.21.38:7574/solr/gettingstarted_shard1_replica2/spell?q=%E7%94%B2&wt=json&indent=true
我得到了例外的回应说
All checkers need to use the same Analyzer
我还尝试从互联网上搜索一些解决方案。并找到了一些解决方案,如下所示。
因此,我尝试按照答案将这些字段更改为相同的字段。
<str name="field">text</str>
<str name="field">name</str>
到同一个领域
像这样 。
...
<str name="field">EntryCNName</str>
....
<str name="field">EntryCNName</str>
这是在架构中定义的。
<field name="EntryCNName" type="text_ik" indexed="true" stored="true"/>
字段类型定义是
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
但不幸的是仍然得到同样的错误。有人可以帮忙弄清楚这个错误是什么意思吗?如何解决?
谢谢。
更新
我取得了一些进展。
我发现应该在架构中定义<str name="field">xx</str>
。searchComponent
并且在requestHandler
.the 的 xxx<str name="spellcheck.dictionary">xxx</str>
应该来自spellchecker
名称。例如,在我的情况下,它们是default
and wordbreak
。
所以我改变了我的配置,如下所示。
架构.xml
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
<field name="_version_" type="long" indexed="true" stored="true"/>
<field name="_root_" type="string" indexed="true" stored="false"/>
<!--<field name="Name" type="string" indexed="true" stored="true"/>-->
<field name="EntityID" type="string" indexed="false" stored="true"/>
<field name="EntryCNName" type="text_ik" indexed="true" stored="true"/>
<field name="EntryEnName" type="string" indexed="true" stored="true"/>
<field name="EntryType" type="string" indexed="false" stored="true"/>
<field name="_text_" type="text_general" indexed="true" stored="true" multiValued="true"/>
<field name="spell" type="textSpell" indexed="true" stored="true" multiValued="true" />
<!--<field name="content" type="text_general" indexed="true" stored="true" required="true" />-->
<copyField source="*" dest="_text_"/>
<copyField source="EntryEnName" dest="spell" />
<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StandardFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StandardFilterFactory" />
</analyzer>
</fieldType>
SolrConfig.xml
<lst name="spellchecker">
<str name="name">default</str>
<str name="classname">solr.IndexBasedSpellChecker</str>
<str name="field">spell</str>
<str name="spellcheckIndexDir">/path/to/my/spell/index</str>
<str name="accuracy">0.7</str>
<float name="thresholdTokenFrequency">.0001</float>
</lst>
<lst name="spellchecker">
<str name="name">wordbreak</str>
<str name="classname">solr.WordBreakSolrSpellChecker</str>
<str name="field">spell</str>
<str name="spellcheckIndexDir">/path/to/my/spell/index</str>
<str name="combineWords">true</str>
<str name="breakWords">true</str>
<int name="maxChanges">10</int>
</lst>
<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="spellcheck.dictionary">default</str>
<!--<str name="spellcheck.dictionary">wordbreak</str>-->
<str name="spellcheck">on</str>
<str name="spellcheck.extendedResults">true</str>
<str name="spellcheck.count">10</str>
<str name="spellcheck.alternativeTermCount">5</str>
<str name="spellcheck.maxResultsForSuggest">5</str>
<str name="spellcheck.collate">true</str>
<str name="spellcheck.collateExtendedResults">true</str>
<str name="spellcheck.maxCollationTries">10</str>
<str name="spellcheck.maxCollations">5</str>
</lst>
<arr name="last-components">
<str>spellcheck</str>
</arr>
</requestHandler>
现在错误消失了。但是当我像这样调用网址时
我得到了空洞的建议。
<lst name="spellcheck">
<lst name="suggestions"/>
<bool name="correctlySpelled">false</bool>
<lst name="collations"/>
</lst>
而实际上。我可以用关键字搜索很多结果lung
。为什么 solr 不建议Lung
我尝试的时候lu
?我错过了什么。谢谢。