问题标签 [overlapping-matches]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
12921 浏览

c# - C# 多字符串匹配

我需要可以匹配多次出现的模式的 C# 字符串搜索算法。例如,如果模式是 'AA' 并且字符串是 'BAAABBB' 正则表达式生成匹配结果索引 = 1,但我需要结果索引 = 1,2。我可以强制正则表达式给出这样的结果吗?

0 投票
6 回答
1518 浏览

java - 正则表达式拆分为重叠字符串

我正在探索正则表达式的力量,所以我只是想知道这样的事情是否可能:

如果可能的话,然后简单地提供正则表达式(并先发制人地解释它是如何工作的)。

如果它只能在 Java 以外的某些正则表达式中实现,那么也可以随意提供。

如果不可能,请解释原因。


奖金问题

同样的问题,但使用find()循环而不是split


请注意,并不是我有一个具体的任务来完成一种或另一种方式,而是我想理解正则表达式。我不需要做我想做的代码;我想要正则表达式,如果它们存在的话,我可以在上面的代码中使用它来完成任务(或者其他风格的正则表达式,可以将代码“直接翻译”成另一种语言)。

如果它们不存在,我想要一个很好的可靠解释为什么。

0 投票
8 回答
49758 浏览

mysql - 检查 MySQL 中日期范围的重叠

该表用于存储会话(事件):

我们不想在范围之间发生冲突。
假设我们需要从2010-01-052010-01-25插入一个新会话。
我们想知道冲突的会话。

这是我的查询:

结果如下:

有没有更好的方法来获得它?


小提琴

0 投票
1 回答
3571 浏览

python - 在 Python 中与 finditer() 重叠匹配

我正在使用正则表达式来匹配文本中的圣经经文参考。当前的正则表达式是

这很好地匹配以下表达式:

但它无法解析:

因为它(None, 'in', '2', None, None, None, None)反而返回。

有没有办法让 finditer() 返回所有匹配项,即使它们重叠,或者有没有办法改进我的正则表达式,使其正确匹配最后一点?

谢谢。

0 投票
4 回答
462 浏览

php - Regex to find sequential integers

I am having a difficult time getting my regular expression code to work properly in PHP. Here is my code:

When this code is ran it will output:

What can I do so that it will match 123, 234, 345 and 456?

Thanks in advance!

0 投票
3 回答
1813 浏览

algorithm - 比较重叠范围

我将使用 Scala 语法问这个问题,即使这个问题真的与语言无关。

假设我有两个列表

我想找到所有testresultgroundtruth.

我可以这样做:

但这需要O(testresult.size * groundtruth.size)时间来运行。

是否有更快的算法来计算这个结果,或者可以使exists测试更高效的数据结构?


PS 该算法应该可以使用如下表达式生成groundtruth和生成。testresult换句话说,不能保证列表中范围之间的关系,Ranges 的平均大小为 100 或更大。

0 投票
2 回答
840 浏览

haskell - 重叠模式匹配

我有以下代码:

当我将它加载到 GHCi (7.0.3) 中时,我得到:

这是一个错误还是我在这里遗漏了什么?

以下持有:


更新:

我正在使用{-# LANGUAGE OverloadedStrings #-}.

0 投票
3 回答
434 浏览

perl - 如何计算多个序列的重叠二聚体?

我必须使用 Perl 计算多个序列中重叠二聚体(AA、AG、AC、AT、GA、GG、GC、GT、CC、CG、CA、CT、TT、TA、TG、TC)的数量。我编写了以下代码,但它仅适用于一个序列。如何将其扩展到多个序列?

我需要:

  1. 每个序列的计数和
  2. 总数

输入示例:sample.txt

0 投票
3 回答
3099 浏览

python - 将范围元组列表折叠到重叠范围中

我正在寻找解决此问题的内存效率最高的方法。

我有一个表示句子中部分字符串匹配的元组列表:

每个元组的第一个值是匹配的开始位置,第二个值是长度。

这个想法是折叠列表,以便只报告最长的连续字符串匹配。在这种情况下,它将是:

我不想要最长的范围,就像在算法中找到最长的非重叠序列一样,但我希望所有的范围都被最长的折叠。

如果您想知道,我正在使用 Aho-Corasick 的纯 python 实现来将静态字典中的术语与给定的文本片段匹配。

编辑:由于这些元组列表的性质,重叠但不是独立的范围应该单独打印出来。例如,在字典中有单词betazandzeta的匹配项betazeta[(0,5),(4,8)]。由于这些范围重叠,但没有包含在另一个范围内,因此答案应该是[(0,5),(4,8)]。我还修改了上面的输入数据集,以便涵盖这种情况。

谢谢!

0 投票
0 回答
134 浏览

r - 在 2 个文件之间寻找重叠值

我有 2 个数据集,每个数据集都包含 Start、End 和 Chromosome 列名。我想比较两个文件中的值,看看是否有任何不重叠的区域(考虑到开始、结束和色度位置)并使用 R 将它们包含在列表中。什么是遍历所有文件的最佳方法两个文件中的数据点并进行比较

文件示例 1:

文件示例 2:

谢谢