elasticsearch - 存储术语向量时参数“存储”是强制性的吗？

Question

我想存储一个领域的术语向量，但我有疑问。他们在文档中说：

"mappings": {
    "tweet": {
      "properties": {
        "text": {
          "type": "text",
          "term_vector": "with_positions_offsets_payloads",
          "store" : true,
          "analyzer" : "fulltext_analyzer"
         }
      }
    }
  }

将存储术语向量。但是术语向量只能通过某个端点访问：

/twitter/tweet/1/_termvectors

而要存储的是字段text。那么如果我想存储我的术语向量而不是字段呢text？如果我不指定，它会存储术语向量"store":true吗？我怎样才能确定我的术语向量是存储的而不是动态计算的？

score 1 · Accepted Answer

您的问题是关于 lucene 功能的区别

可能的 https://de.slideshare.net/lucenerevolution/what-is-inaluceneagrandfinal 可以提供帮助：

查询时不使用字段的存储值。您可以在搜索结果中使用它并（慢）突出显示

只有倒排索引用于搜索（例如，可能用于短语查询的位置）。

可选的文档值可用于排名

score 1 · Accepted Answer

当您term_vector在映射中指定时，术语向量将被存储（no当然还有任何可能的选项）。请参阅term_vector 文档——那里的示例映射不包括"store":true，并且文档明确表示将存储术语向量。

elasticsearch - 存储术语向量时参数“存储”是强制性的吗？

2 回答 2

Related

Reference