问题标签 [match-phrase]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
json - JSON 上的 Elasticsearch 精确短语匹配
我正在使用弹性搜索从 json 字段中进行精确的短语匹配。我已经尝试过multi_match、query_string和simple_query_string等多种语法,但它们并没有完全按照给定的短语返回结果。
我正在使用的query_string语法;
我也尝试了过滤器而不是查询,但过滤器在 json 上没有给出任何结果。我用于过滤器的语法是;
现在的问题是;
是否可以使用elasticsearch对json执行精确匹配操作?
elasticsearch - Elasticsearch 重要术语聚合 doc_count 在对相同术语进行匹配短语搜索时与命中不同
我正在使用重要术语聚合,它使用以下查询为我提供了 n 重要术语及其 doc_count 和 bg_count:
如果我采用重要术语聚合返回的术语并对该术语进行匹配短语查询。然后,我得到的 hits 值与聚合中的 doc_count 不同。
匹配词组查询:
该字段preprocess_data.results.alternatives.transcript
具有以下映射:
在进行聚合和匹配短语搜索时,我无法解释文档计数的差异。请帮忙。
elasticsearch - Elastic Search 1.4 短语查询,在搜索字符串中使用带有连字符 (-) 的 OR 运算符
我在 Elastic search 1.4 短语查询中遇到问题。我正在使用数据创建以下索引。
curl -XPUT localhost:9200/test
curl -XPOST localhost:9200/test/doc/1 -d '{"field1" : "abc-xyz"}'
curl -XPOST localhost:9200/test/doc/2 -d '{"field1" : "bcd-gyz"}'
因此,默认情况下 field1 通过弹性搜索使用默认分析器进行分析。
我正在下面的短语查询中搜索,但它没有返回任何结果。
所以弹性搜索短语查询不适用于 OR 运算符。知道为什么它不起作用,是否因为文本中的特殊字符连字符 (-) 而限制了弹性搜索?
elasticsearch - How to turn off autocomplete for easticsearch match_phrase or match_phrase_prefix?
I have ES data, which contains a field name
of type text
. I have to search by a lowercase input, while the actual name might use lower and uppercase symbols. I need only the exact (but case insensitive) names.
I try to use match_phrase
(as well as match_phrase_prefix
). But it returns results with autocompleting. Like query
returns two items:
and
I need only the one with id: 547
, i.e. where there are no extra symbols in the name.
Does Elastcsearch have tools to find the exact name, but in a case insensitive form and without autocomplete?
elasticsearch - 弹性搜索中的查询字符串
我正在使用以下匹配查询搜索弹性搜索,这并没有给我完全匹配,而是给我一些更不重要的匹配。
我正在使用弹性搜索 6.3
请在下面找到我的查询
搜索结果:
“命中”:[{“_index”:“67107104”,“_type”:“_doc”,“_id”:“1”,“_score”:0.6931471,“_source”:{“title”:“testing”}} ,{“_index”:“67107104”,“_type”:“_doc”,“_id”:“2”,“_score”:0.6931471,“_source”:{“title”:“产品好”}},{“ _index”:“67107104”,“_type”:“_doc”,“_id”:“3”,“_score”:0.6931471,“_source”:{“title”:“sample”}},{“_index”:“ 67107104”,“_type”:“_doc”,“_id”:“4”,“_score”:0.7897571,“_source”:{“title”:“superr”} } ]
预期的搜索结果:
“命中”:[{“_index”:“67107104”,“_type”:“_doc”,“_id”:“1”,“_score”:0.6931471,“_source”:{“title”:“testing”}} ,{“_index”:“67107104”,“_type”:“_doc”,“_id”:“2”,“_score”:0.6931471,“_source”:{“title”:“产品好”}}]
elasticsearch - ElasticSearch:不匹配
我想执行完全单词匹配和部分单词/子字符串匹配。例如,如果我搜索“测试产品”,那么我应该能够在结果中找到“测试”和“产品”相关的文本。我正在使用以下匹配查询搜索弹性搜索,这并没有给我完全匹配,而是它也给出了一些更不重要的匹配。例如,它在结果中给出了“样本”相关的文本。
我正在使用弹性搜索 6.3
请在下面找到我的查询
GET /_search { "must":{ "query_string":{ "query":"title: test product " } } }
搜索结果:“hits”:[ {“_index”:“67107104”,“_type”:“_doc”,“_id”:“1”,“_score”:0.6931471,“_source”:{“title”:“testing " } }, { "_index": "67107104", "_type": "_doc", "_id": "2", "_score": 0.6931471, "_source": { "title": "product good" } } ,{“_index”:“67107104”,“_type”:“_doc”,“_id”:“3”,“_score”:0.6931471,“_source”:{“title”:“sample”}}]
预期的搜索结果:
“命中”:[{“_index”:“67107104”,“_type”:“_doc”,“_id”:“1”,“_score”:0.6931471,“_source”:{“title”:“testing”}} ,{“_index”:“67107104”,“_type”:“_doc”,“_id”:“2”,“_score”:0.6931471,“_source”:{“title”:“产品好”}}]
elasticsearch - Match_phrase 是弹性搜索未按预期工作
在我的弹性搜索中,我的文档包含一个“字段名”,其值为“abc”和“abc-def”。当我使用 match_phrase 查询搜索字段名为“abc”的文档时,它也会返回值为“abc-def”的文档。但是,当我查询“abc-def”时,它工作正常。我的查询如下:
有人可以帮我理解这个问题吗?
regex - Elasticsearch 通配符、正则表达式、match_phrase、前缀查询返回错误结果
我刚刚开始使用 Elasticsearch,版本 7.5.1。
我想查询以特定单词片段开头的结果。例如tho * 应该返回包含以下内容的数据:
思想,汤姆森,那些,等等。
我试过 -
- 正则表达式
- 通配符
- 字首
- 匹配短语
所有这些都返回正确的结果,但它们也都返回单词method。
同样cat * 正在返回单词communication。
我做错了什么?这与分析器有关吗?
- 编辑-这是字段映射-
python - Python中的Spacy正则表达式短语匹配器
在大量文本语料库中,我有兴趣提取句子中某处具有(动词-名词)或(形容词-名词)特定列表的每个句子。我有一个很长的清单,但这里有一个示例。在我的 MWE 中,我试图用“write/wrote/writing/writes”和“book/s”提取句子。我有大约 30 对这样的词。
这是我尝试过的,但它没有捕捉到大多数句子:
不幸的是,我只有一场比赛:
“在写这本书时,他必须抵御外星人和恐龙。”
然而,我也希望得到“他写了他的第一本书”这句话。其他写书将作家作为名词,其好处是不匹配。
python - 需要帮助来匹配python中数据框多列的短语中的字符串
在匹配下面给出的数据中的短语时需要帮助,我需要匹配来自 TextA 和 TextB 的短语。
以下代码没有帮助我做到这一点我该如何解决这个我有100个要匹配
#排序混乱的短语
#删除字符串中的标点符号
#匹配字符串
即使在实现字符串排序、删除标点符号和区分大小写之后,我仍然认为这些字符串不匹配。我在这里遗漏了一些东西可以帮助我实现它