问题标签 [matching]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1662 浏览

c# - 解析日志文件并获取匹配数据

从大日志文件(大约 2532910 行)中,我正在寻找的行很少(比如 10 或 12)。匹配和阅读这些行的最佳方法是什么?我的代码在 c# 中。有没有办法让阅读器/流只能读取模式匹配数据?

谢谢

0 投票
3 回答
352 浏览

jquery - jQuery:循环遍历将其 ID 属性写入数组的元素?

<label>s我正在尝试根据一组元素及其 id 属性以我的形式找到一堆。

例如[ input#country , input#other-country ]将能够找到<label for="country"> , <label for="other-country">等等......</p>

到目前为止,我有这个代码:

注销循环input.id内部时,$.each我得到了正确的值被写出但是我似乎无法找到一种方法将我的匹配label元素从$.each循环内部写入LOCATION.labels数组。

有谁知道如何将它们放入数组中?toArray()似乎也不起作用……</p>

谢谢阅读。

0 投票
2 回答
5003 浏览

algorithm - 工人调度算法

问题

这是我要解决的问题的本质。我们有工人在周末的固定时间在托儿所照顾孩子。一个周末有 16 个不同的位置可以填补。因此,在为期 4 周的月份中,有 64 个空位可以填补。我们最多有 30 名托儿所工作人员(尽管我们需要更多。有人喜欢孩子吗?)。

编辑:每个时间段都是离散的——它们不重叠。

目前每个月都有一个人提出托儿所的时间表。根据每个人的喜好每个月制定这个时间表是一项复杂且耗时的任务。在考虑了这个问题后,我心想:“一定有更好的方法!”

算法

我注意到这个问题本质上是一个二分图婚姻问题也是一个二分图,您可以使用像Edmonds 的匹配算法这样的匹配算法来解决它。

但这假设一个节点集中的每个节点只匹配另一个节点集中的一个节点。就我而言,每个托儿所工作人员只能工作一个时间段。由于我们人手严重不足,那是行不通的!一群人将不得不每月工作两次来填补所有的时间段。

这似乎意味着这更像是经典的“医院/居民问题”。它与婚姻问题的不同之处在于“女人”可以接受来自多个“男人”的“求婚”(例如,一家医院可以接收多个居民)。就我而言,一名托儿所工作人员可以占用多个时间段。

现在怎么办?

哇!

现在我已经设置好了....有人知道解释或显示这种算法的任何好的链接吗?有没有更好的方法来解决这个问题?我是不是想多了?我在谷歌上搜索了“医院居民算法”并找到了研究生论文。呸!我毕业于 CS 学位并参加了 AI 课程……但那是 6 年前的事了。帮助!

Aaaaany 建议表示赞赏!

0 投票
3 回答
1625 浏览

java - Lucene 通配符匹配在化学符号上失败(?)

使用 Hibernate Search Annotations(大部分只是@Field(index = Index.TOKENIZED))我已经索引了一些与我的一个名为 Compound 的持久类相关的字段。我已经使用 对所有索引字段设置了文本搜索,MultiFieldQueryParser到目前为止效果很好。

在索引和可搜索的字段中,有一个名为 CompoundName 的字段,其中包含示例值:

  • 3-Hydroxyflavone
  • 6,4'-Dihydroxyflavone

当我完全搜索这些值中的任何一个时,都会返回相关的 Compound 实例。但是,当我使用部分名称并引入通配符时会出现问题:

  • 搜索3-Hydroxyflav*仍然给出正确的命中,但是
  • 搜索6,4'-Dihydroxyflav*未能找到任何东西。

现在由于我对 Lucene / Hibernate-search 很陌生,我不太确定在哪里看这一点。我认为这可能与'第二个查询中的当前有关,但我不知道如何继续.. 我应该完全研究 Tokenizers / Analyzers / QueryParsers 还是其他东西?

或者谁能​​告诉我如何让第二个通配符搜索匹配,最好不要破坏多字段搜索行为?

我正在使用 Hibernate-Search 3.1.0.GA 和 Lucene-core 2.9.3。


一些相关的代码位来说明我目前的方法:

索引 Compound 类的相关部分:

我目前如何搜索索引字段:

0 投票
2 回答
162 浏览

vim - 在匹配之间复制,而不是在行之间复制,而是在匹配点之间复制

我尽量不使用“写”、“放”或“读”这些词,因为 VIM 对它们有特殊意义。我尝试将匹配项之间的内容复制(抱歉没有提到 VIM 的复制命令)到文件。你是怎么做到的,而不是复制整行?

虚拟示例

文本:

不要模仿我 dummy1 hello world 请模仿我 dummy2 不要模仿我

一些进入,应该也可以与进入顺便说一句匹配点虚拟1还没有!

还没有!

副本即将结束!假人2

已复制:

你好世界请复制我

或者

dummy1 你好世界,请复制我 dummy2

0 投票
2 回答
695 浏览

c# - 正则表达式在 #if debug #endif 块中提取字符串

我有一个包含大量 #if 调试块的应用程序,如下所示:

我正在使用 Resharper 的搜索模式匹配功能,如果调试块,我需要能够在其中找到字符串“Logging.Log”的所有实例

有人知道这个模式搜索的正则表达式应该是什么吗?

0 投票
2 回答
768 浏览

algorithm - 什么样的算法更适合无序序列匹配问题?

如果我有两个序列(例如,字符串)

我想知道从 b 到 a 的最佳子字符串匹配(无序),例如:

还有另一种解决方案,但不是最优的:

什么样的算法更适合这个问题???(我需要最佳结果,性能至关重要)。

谢谢。

0 投票
4 回答
5640 浏览

algorithm - 简历匹配算法

我正在建立一个工作站点——是的,这些站点还不够。我在研究中遇到的问题之一是如何将相关简历与感兴趣的招聘人员相匹配。我想到的最无聊的解决方案是使用文本分析来解析招聘人员指定标签的简历——这有一个缺点:简历可能包含隐藏的关键字或流行语。然后有趣的是弄清楚如何解决这个问题。解决这个问题的更有趣的方法是什么?(也许是某种机器学习算法?那么你也必须训练这头野兽。)

所以我还不知道该怎么做。我欢迎您提供任何建议。

0 投票
1 回答
2803 浏览

algorithm - Maximum weight bipartite matching

I have a graph in form of a rectangular grid, i.e. N nodes and 2N edges, all adjacent nodes are connected. This means it is two-colourable, and hence it is possible to do bipartite matching on it.

Each (undirected) edge has a weight assigned to it - either -2, -1, 0, 1 or 2. No other values are allowed

How would I go about finding the matching on this graph that maximises the sum of the weighs in the matching? Pseudocode would be nice, don't bother with specific languages.

Ideally, I am looking for an algorithm that runs in quadratic time - maybe O(n^2 log n) at worst.


Before you propose a solution, I have tried doing a max match using edges of weight 2, then of weight 1 (without going over edges of weight 2). I have scored 98% with this implementation (the problem is from an informatics olympiad), and wondering what is the 100% solution.

0 投票
3 回答
994 浏览

search - 呼叫搜索专家:Lucene 的数值范围搜索性能?

我正在开发一个基于字符串和数字范围以及日期范围对大量记录执行匹配的系统。据我所知,字符串匹配大多是精确匹配,而不是我理解 lucene 通常设计用于的不太精确的全文搜索类型结果。由于数据涉及价格,因此数值精度很重要。

我注意到 Lucene 最近添加了一些对数字范围搜索的支持,但这并不是它最初设计的目的。

目前,系统使用过程 SQL 进行匹配,系统的可扩展性已达到极限。我正在研究水平扩展系统的方法,并且使用搜索引擎技术似乎是一种可能性,因为有些技术可以扩展到非常大的数据集,同时执行非常快速的搜索结果。我想调查是否可以通过与 lucene 生成的元数据进行匹配来减轻数据库的大量负载,而无需在数据库中获取完整记录,直到匹配规则确定应该检索什么。我希望最终以接近实时的结果为目标,尽管在这一点上我们还有很长的路要走。

我的问题如下:对于这种类型的索引和搜索,Lucene 的执行速度是否可能比 RDBMS 的执行速度快很多倍并且扩展到更大的数据集更便宜?