2

我想存储一个领域的术语向量,但我有疑问。他们在文档中说:

"mappings": {
    "tweet": {
      "properties": {
        "text": {
          "type": "text",
          "term_vector": "with_positions_offsets_payloads",
          "store" : true,
          "analyzer" : "fulltext_analyzer"
         }
      }
    }
  }

将存储术语向量。但是术语向量只能通过某个端点访问:

/twitter/tweet/1/_termvectors

而要存储的是字段text。那么如果我想存储我的术语向量而不是字段呢text?如果我不指定,它会存储术语向量"store":true吗?我怎样才能确定我的术语向量是存储的而不是动态计算的?

4

2 回答 2

1

您的问题是关于 lucene 功能的区别

可能的 https://de.slideshare.net/lucenerevolution/what-is-inaluceneagrandfinal 可以提供帮助:

查询时不使用字段的存储值。您可以在搜索结果中使用它并(慢)突出显示

只有倒排索引用于搜索(例如,可能用于短语查询的位置)。

可选的文档值可用于排名

于 2017-08-30T07:29:59.443 回答
1

当您term_vector在映射中指定时,术语向量将被存储(no当然还有任何可能的选项)。请参阅term_vector 文档——那里的示例映射不包括"store":true,并且文档明确表示将存储术语向量。

于 2017-08-30T07:17:51.457 回答