0

朋友们,

我目前使用 KStemmer 在我使用 solr 开发的应用程序中执行词干提取操作。发现当我们使用 kStemmer 时,它并没有使用 protwords.txt

<analyzer type="query">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
    <filter class="solr.StopFilterFactory"
            ignoreCase="true"
            words="stopwords.txt"
            enablePositionIncrements="true"
            />
    <filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EnglishPossessiveFilterFactory"/>
    <filter class="solr.KStemFilterFactory" protected="protwords.txt"/>

  </analyzer>

它没有将原词中的文字视为受保护的。这是 Kstem 的工作原理吗?

4

1 回答 1

1

我检查了源代码,但看不到实现。顺便说一句,我检查了 Solr 3.6 的源代码。

它在SnowballPorterFilterFactory中实现,但不在KStemFilterFactory中实现。

于 2012-10-03T11:54:18.720 回答