1

我在 Windows 机器上使用 apache-solr-3.6.0。我想在索引之前删除所有标点符号,除了冒号和句号。

我试过:

<fieldType name="text_ar" class="solr.TextField" positionIncrementGap="100">
      <analyzer> 
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.PatternReplaceFilterFactory" pattern="[\p{Punct}&&[^\.^\:]]" replacement="" replace="all"/>
      </analyzer>
    </fieldType>

但它没有用。有任何想法吗?

4

1 回答 1

2

使用以下模式过滤器代替您的。

<filter class="solr.PatternReplaceFilterFactory" pattern="([^a-zA-Z0-9.:])" replacement="" replace="all"/>
于 2012-09-24T10:22:22.417 回答