1

我正在尝试将 haystack 默认设置更改为非常简单的设置:

'settings': {
  "analyzer": "spanish"
}

它在重建索引后看起来很正确:

$ curl -XGET 'http://localhost:9200/haystack/_settings?pretty=true'
{
  "haystack" : {
    "settings" : {
      "index.analyzer" : "spanish",
      "index.number_of_shards" : "5",
      "index.number_of_replicas" : "1",
      "index.version.created" : "191199"
    }
  }

但是当使用一些停用词对其进行测试时,它不会按预期工作,它应该过滤掉“esto”和“que”,而是从英语停用词中过滤“is”和“a”:

$ curl -XGET 'localhost:9200/haystack/_analyze?text=esto+is+a+test+que&pretty=true'
{
  "tokens" : [ {
    "token" : "esto",
    "start_offset" : 0,
    "end_offset" : 4,
    "type" : "<ALPHANUM>",
    "position" : 1
  }, {
    "token" : "test",
    "start_offset" : 10,
    "end_offset" : 14,
    "type" : "<ALPHANUM>",
    "position" : 4
  }, {
    "token" : "que",
    "start_offset" : 15,
    "end_offset" : 18,
    "type" : "<ALPHANUM>",
    "position" : 5
  } ]

只有当我在查询中指定分析器时它才起作用:

$ curl -XGET 'localhost:9200/haystack/_analyze?text=esto+is+a+test+que&analyzer=spanish&pretty=true'
{
  "tokens" : [ {
    "token" : "is",
    "start_offset" : 5,
    "end_offset" : 7,
    "type" : "<ALPHANUM>",
    "position" : 2
  }, {
    "token" : "test",
    "start_offset" : 10,
    "end_offset" : 14,
    "type" : "<ALPHANUM>",
    "position" : 4
  } ]

知道我在做什么错吗?

谢谢。

4

2 回答 2

1

它应该是

"settings": {
    "index.analysis.analyzer.default.type" : "spanish"
}
于 2012-11-26T21:59:52.640 回答
1

并将其应用于“干草堆”索引:

{
  "haystack" : {
    "settings" : {
      "index.analysis.analyzer.default.type" : "spanish",
  }
}

感谢 imotov 的建议。

于 2012-11-27T09:02:18.700 回答