问题标签 [exact-match]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
8911 浏览

elasticsearch - 如何对 Elasticsearch 中的分析字段执行完全匹配查询?

这可能是一个非常常见的问题,但是到目前为止我得到的答案并不令人满意。

问题:我有一个由近100个字段组成的es索引。大多数字段都是stringtype 并设置为analyzed. 但是,查询既可以是部分的(match),也可以是精确的(更像term)。因此,如果我的索引包含一个带有 value 的字符串字段super duper cool pizza,则可能存在部分查询,duper super并且将与文档匹配,但是,可能存在cool pizza不应该与文档匹配的精确查询。另一方面,Super Duper COOL PIzza又要与这个文件相匹配。

到目前为止,部分匹配部分很容易,我在查询中使用AND了运算符。match但是无法完成其他类型。

我查看了与此问题相关的其他帖子,并且该帖子包含最接近的解决方案: Elasticsearch 精确匹配分析字段

在这三个解决方案中,第一个感觉非常复杂,因为我有很多字段并且我不使用 REST api,我使用 QueryBuilders 和 NativeSearchQueryBuilder 从他们的 Java api 动态创建查询。它还会产生许多可能的模式,我认为这些模式会导致性能问题。

第二个是一个更简单的解决方案,但同样,我必须维护更多(几乎)冗余数据,而且我认为使用term查询永远不会解决我的问题。

最后一个我认为有问题,它不会阻止super duper匹配super duper cool pizza不是我想要的输出。

那么我还有其他方法可以实现目标吗?如果需要进一步清除问题,我可以发布一些示例映射。我也已经保留了源代码(以防万一)。请随时提出任何改进建议。

提前致谢。

[更新]

最后,我使用multi_field,为精确查询保留一个原始字段。当我插入时,我对数据使用了一些自定义修改,在搜索过程中,我对输入文本使用了相同的修改例程。这部分不由 Elasticsearch 处理。如果你想这样做,你还必须设计合适的分析器。

索引设置和映射查询:

插入一些示例数据:

准确查询:

回复:

部分查询:

回复:

PS:这些是生成的查询,这就是为什么会有一些冗余块,因为会有许多其他字段连接到查询中。

可悲的是,现在我需要再次重写整个映射:(

0 投票
1 回答
45 浏览

excel - Excel - 使用位于不同单元格中的单词,使用精确匹配进入 SUMIFS 公式

我正在寻找可以使用输入到不同单元格中的单词的 SUMIFS 公式,因此如果稍后要更改单词,它也会自动更新公式。

这是一个例子:

CELL A -苹果

CELL B -香蕉

CELL C -橙色

这是我现在使用的公式:

这就是我想要做的:

我希望这是有道理的!我对这里还是很陌生。

先感谢您。

0 投票
4 回答
210 浏览

sas - SAS where 条件完全匹配

感谢您的反馈,但我必须重写问题以使其更清楚。

说,我们有一张桌子:

桌子

我想从这个表中得到一个数字列表,这些数字的 FP_NDT 日期与我的情况相匹配,例如,我想获得一个数字列表,其中只有 2014 年和 2015 年的 FP_NDT 不为空,2011 年的缺失值、2012 年和 2013 年(与月份无关)。所以在这种情况下,我应该只得到 4 号。是否可以从这张表中做到这一点?

PS:如果我写一个简单的 sql select 语句并放一个类似的条件

它也会给我数字 2 和 3 ......

0 投票
1 回答
1192 浏览

r - 当我还使用倾向得分时,如何将 R 中 Match 函数的确切参数应用于一个变量

我想使用 R 中 {Matching} 的匹配函数来估计平均治疗效果对治疗(ATT)的影响,倾向得分作为距离,一对一匹配作为匹配方法。在同一个匹配模型中,我想使用确切的参数并将其应用于一个特定的变量。

在运行 logit 函数来估计倾向得分后,如下所示:

在运行Match函数时,我尝试将确切的参数应用于第 26 个变量(“标题”) 。代码如下所示:

尽管如此,我还是收到了以下警告消息:

我相信这是一个与 X (=glm1$fitted) 的结构有关的问题。因为当我只使用以下矩阵时:

作为 X 并重新运行 Match 函数:

它工作正常!

为了能够同时使用倾向得分 (glm1$fitted) 和“标题”的确切参数 = 1,代码应该是什么样子?

0 投票
1 回答
322 浏览

filter - 在 Kendo UI AutoComplete 中实现“精确”过滤器选项

有没有办法覆盖/添加 Kendo UI 自动完成的“精确”过滤器选项。(目前过滤字段只有“startswith”、“contains”和“endswith”三个选项。)对于“exact”过滤选项,所有与当前小部件值具有完全相同数据的数据项将被显示在建议弹出窗口中。

代码片段如下:

$("#someInputId").kendoAutoComplete({
minLength: 1,
dataTextField: "lastName",
dataSource: data,
filter: "exact",
placeholder: "Enter here...",
separator: ", "
});

如果用户输入的词与数据集的lastName字段完全匹配,则会弹出所有对应的数据项。

非常感谢您的帮助。

0 投票
1 回答
723 浏览

javascript - 如何在 HTML 表格中仅搜索与我在搜索栏中的输入完全匹配的内容?

我目前正在使用下面的代码为网站上的 HTML 表创建单列搜索。目前,当我在搜索栏中输入内容时,代码会返回每一行,其中的内容包含我在其中任何位置搜索的内容。例如(我将其用于电影评级),当我在搜索栏中输入“G”时,我会返回所有评级为 G 的内容,以及所有评级为 PG 或 PG-13 的内容。有没有办法可以调整此代码以仅返回与我的搜索完全匹配的结果?换句话说,有没有办法改变事情,这样当我搜索“G”(或“g”)时,我只得到我的 G 级电影,而不是任何评级为 PG 或 PG-13 的电影?

谢谢!

当前代码:

0 投票
4 回答
235 浏览

regex - Perl 正则表达式多行匹配没有点

关于如何在 Perl 中执行多行正则表达式有很多问题。他们中的大多数都提到了s使点匹配换行符的开关。但是,我想匹配一个确切的短语(所以,不是模式),我不知道换行符在哪里。所以问题是:你可以忽略换行符,而不是将它们与.?

MWE:

我可以在模式中放置点而不是空格 ( "Match.this.exact.phrase"),但这不适用于第二个示例。我可以删除所有换行符作为预处理,但我想保留不属于匹配项的换行符(如第三个示例所示)。

期望的输出:

0 投票
1 回答
3319 浏览

python - 熊猫:一列的近似连接,其他列的完全匹配

我有两个熊猫数据框,我想在一个(日期)列上精确地加入/合并多个列(比如 3)和大约,即最近的邻居。我还想返回它们之间的差异(天数)。每个数据集大约有 50,000 行长。我对内部连接最感兴趣,但如果不太难掌握,“剩余”也很有趣。大多数“完全匹配”观察结果将在每个数据帧中多次存在。

我一直在尝试将difflib.get_close_matches用作字符串的所有连接(这很愚蠢,我知道!)但并不总是给出完全匹配的。我想我需要先遍历确切的匹配项,然后在该组中找到最近的匹配项,但我似乎无法做到正确......

数据框看起来像:

最后我想要类似的东西:

或者如果只使用内部连接更容易,我想:

0 投票
1 回答
790 浏览

excel - Excel MATCH 和 SUMIF 公式与 Wxact 匹配不匹配

我有一张带有精确值的工作表(通过=a2=b2返回验证true)。

但是,=match(a2,b2,0)返回#N/A某些值,但不是全部。

所有单元格的格式都相同(我尝试过常规、文本、数字等),我不知道从哪里开始。

我不知道我是否可以在这里上传我的测试工作簿,所以这是一张图片:

图片

0 投票
1 回答
347 浏览

java - 弹性搜索中的精确匹配

我已将大型 pdf 文件索引到弹性搜索引擎中。我已经用雪球分析器分析了这个非结构化数据。这将使用雪球过滤器将“跑步”等单词转换为“跑步”。但是如果我想准确搜索“跑步”这个词怎么办?这对我没有帮助。

我不能去使用另一个字段,因为这些是更大的文件,并且可以在更大程度上增加索引大小。

那么如何使用雪球过滤器来使用“preserver_original”之类的东西。这样我就可以将原始单词与词干单词一起保留。

有什么方法或替代方法可以根据我的要求分析该领域吗?