0

所有,我正在尝试在 Solr 5.3.1 中应用拼写检查。

目前 Solr 5.3.1 已经包含SpellCheckComponent. 如下所示。

<searchComponent name="spellcheck" class="solr.SpellCheckComponent">
        <str name="queryAnalyzerFieldType">text_general</str>
        <lst name="spellchecker">
            <str name="name">default</str>
            <str name="field">text</str>
            <str name="classname">solr.DirectSolrSpellChecker</str>
            <str name="distanceMeasure">internal</str>
            <float name="accuracy">0.5</float>
            <int name="maxEdits">2</int>
            <int name="minPrefix">1</int>
            <int name="maxInspections">5</int>
            <int name="minQueryLength">4</int>
            <float name="maxQueryFrequency">0.01</float>
        </lst>
        <lst name="spellchecker">
            <str name="name">wordbreak</str>
            <str name="classname">solr.WordBreakSolrSpellChecker</str>
            <str name="field">name</str>
            <str name="combineWords">true</str>
            <str name="breakWords">true</str>
            <int name="maxChanges">10</int>
        </lst>
</searchComponent>

但是当我尝试使用此功能时。像这样。

http://10.2.21.38:7574/solr/gettingstarted_shard1_replica2/spell?q=%E7%94%B2&wt=json&indent=true

我得到了例外的回应说

All checkers need to use the same Analyzer

我还尝试从互联网上搜索一些解决方案。并找到了一些解决方案,如下所示。

Solr 4.0 如何更改拼写检查器分析器以使它们都相同?

Solr 拼写检查:无法显示结果,总是收到相同的错误

因此,我尝试按照答案将这些字段更改为相同的字段。

<str name="field">text</str>
<str name="field">name</str>

到同一个领域

像这样 。

...
<str name="field">EntryCNName</str>

....
<str name="field">EntryCNName</str>

这是在架构中定义的。

<field name="EntryCNName" type="text_ik" indexed="true" stored="true"/>

字段类型定义是

<fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

但不幸的是仍然得到同样的错误。有人可以帮忙弄清楚这个错误是什么意思吗?如何解决?

谢谢。

更新

我取得了一些进展。

我发现应该在架构中定义<str name="field">xx</str>searchComponent并且在requestHandler.the 的 xxx<str name="spellcheck.dictionary">xxx</str>应该来自spellchecker名称。例如,在我的情况下,它们是defaultand wordbreak

所以我改变了我的配置,如下所示。

架构.xml

    <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
    <field name="_version_" type="long" indexed="true" stored="true"/>
    <field name="_root_" type="string" indexed="true" stored="false"/>
    <!--<field name="Name" type="string" indexed="true" stored="true"/>-->
    <field name="EntityID" type="string" indexed="false" stored="true"/>
    <field name="EntryCNName" type="text_ik" indexed="true" stored="true"/>
    <field name="EntryEnName" type="string" indexed="true" stored="true"/>
    <field name="EntryType" type="string" indexed="false" stored="true"/>
    <field name="_text_" type="text_general" indexed="true" stored="true" multiValued="true"/>
    <field name="spell" type="textSpell" indexed="true" stored="true" multiValued="true" />
    <!--<field name="content" type="text_general" indexed="true" stored="true" required="true" />-->
    <copyField source="*" dest="_text_"/>
    <copyField source="EntryEnName" dest="spell" />



<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
        <analyzer type="index">
            <tokenizer class="solr.StandardTokenizerFactory" />
            <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
            <filter class="solr.LowerCaseFilterFactory" />
            <filter class="solr.StandardFilterFactory" />
        </analyzer>
        <analyzer type="query">
            <tokenizer class="solr.StandardTokenizerFactory" />
            <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
            <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
            <filter class="solr.LowerCaseFilterFactory" />
            <filter class="solr.StandardFilterFactory" />
        </analyzer>
    </fieldType>

SolrConfig.xml

<lst name="spellchecker">
            <str name="name">default</str>
            <str name="classname">solr.IndexBasedSpellChecker</str>
            <str name="field">spell</str>
            <str name="spellcheckIndexDir">/path/to/my/spell/index</str>
            <str name="accuracy">0.7</str>
            <float name="thresholdTokenFrequency">.0001</float>

        </lst>

        <lst name="spellchecker">
            <str name="name">wordbreak</str>
            <str name="classname">solr.WordBreakSolrSpellChecker</str>
            <str name="field">spell</str>
            <str name="spellcheckIndexDir">/path/to/my/spell/index</str>
            <str name="combineWords">true</str>
            <str name="breakWords">true</str>
            <int name="maxChanges">10</int>
        </lst>



<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
        <lst name="defaults">

            <str name="spellcheck.dictionary">default</str>
            <!--<str name="spellcheck.dictionary">wordbreak</str>-->
            <str name="spellcheck">on</str>
            <str name="spellcheck.extendedResults">true</str>
            <str name="spellcheck.count">10</str>
            <str name="spellcheck.alternativeTermCount">5</str>
            <str name="spellcheck.maxResultsForSuggest">5</str>
            <str name="spellcheck.collate">true</str>
            <str name="spellcheck.collateExtendedResults">true</str>
            <str name="spellcheck.maxCollationTries">10</str>
            <str name="spellcheck.maxCollations">5</str>
        </lst>
        <arr name="last-components">
            <str>spellcheck</str>
        </arr>
    </requestHandler>

现在错误消失了。但是当我像这样调用网址时

http://10.2.21.38:7574/solr/gettingstarted_shard1_replica2/spell?q=lu&spellcheck=true&spellcheck.collat​​e=true&spellcheck.build=true

我得到了空洞的建议。

<lst name="spellcheck">
<lst name="suggestions"/>
<bool name="correctlySpelled">false</bool>
<lst name="collations"/>
</lst>

而实际上。我可以用关键字搜索很多结果lung。为什么 solr 不建议Lung我尝试的时候lu?我错过了什么。谢谢。

在此处输入图像描述

4

0 回答 0