0

以便搜索“示例”返回“(示例)”

我试图将括号 UTF 代码放在 ignore_chars 中,但这不起作用。

当前配置如下:

production:
  version: 1.10-beta
  wordforms: lib/wordforms.txt
  stopwords: lib/stopwords.txt 
  charset_table: "0..9, a..z, _, U+023, A..Z->a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F"
  ignore_chars: "U+0027, U+0028"
  morphology: stem_en
4

1 回答 1

0

charset_table 中未列出的所有字符都被视为分隔符。因此,由于您的字符集表中没有它们,它们永远不会被索引为单词的一部分。

所以无论如何它都会起作用。你一定有别的问题。

注意,圆括号是十六进制 28 和 29。27 是单引号。

于 2013-01-23T12:31:24.467 回答