问题标签 [overlapping-matches]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - C# 多字符串匹配
我需要可以匹配多次出现的模式的 C# 字符串搜索算法。例如,如果模式是 'AA' 并且字符串是 'BAAABBB' 正则表达式生成匹配结果索引 = 1,但我需要结果索引 = 1,2。我可以强制正则表达式给出这样的结果吗?
java - 正则表达式拆分为重叠字符串
我正在探索正则表达式的力量,所以我只是想知道这样的事情是否可能:
如果可能的话,然后简单地提供正则表达式(并先发制人地解释它是如何工作的)。
如果它只能在 Java 以外的某些正则表达式中实现,那么也可以随意提供。
如果不可能,请解释原因。
奖金问题
同样的问题,但使用find()
循环而不是split
:
请注意,并不是我有一个具体的任务来完成一种或另一种方式,而是我想理解正则表达式。我不需要做我想做的代码;我想要正则表达式,如果它们存在的话,我可以在上面的代码中使用它来完成任务(或者其他风格的正则表达式,可以将代码“直接翻译”成另一种语言)。
如果它们不存在,我想要一个很好的可靠解释为什么。
mysql - 检查 MySQL 中日期范围的重叠
该表用于存储会话(事件):
我们不想在范围之间发生冲突。
假设我们需要从2010-01-05到2010-01-25插入一个新会话。
我们想知道冲突的会话。
这是我的查询:
结果如下:
有没有更好的方法来获得它?
python - 在 Python 中与 finditer() 重叠匹配
我正在使用正则表达式来匹配文本中的圣经经文参考。当前的正则表达式是
这很好地匹配以下表达式:
但它无法解析:
因为它(None, 'in', '2', None, None, None, None)
反而返回。
有没有办法让 finditer() 返回所有匹配项,即使它们重叠,或者有没有办法改进我的正则表达式,使其正确匹配最后一点?
谢谢。
php - Regex to find sequential integers
I am having a difficult time getting my regular expression code to work properly in PHP. Here is my code:
When this code is ran it will output:
What can I do so that it will match 123, 234, 345 and 456?
Thanks in advance!
algorithm - 比较重叠范围
我将使用 Scala 语法问这个问题,即使这个问题真的与语言无关。
假设我有两个列表
我想找到所有testresult
与groundtruth
.
我可以这样做:
但这需要O(testresult.size * groundtruth.size)
时间来运行。
是否有更快的算法来计算这个结果,或者可以使exists
测试更高效的数据结构?
PS 该算法应该可以使用如下表达式生成groundtruth
和生成。testresult
换句话说,不能保证列表中范围之间的关系,Range
s 的平均大小为 100 或更大。
haskell - 重叠模式匹配
我有以下代码:
当我将它加载到 GHCi (7.0.3) 中时,我得到:
这是一个错误还是我在这里遗漏了什么?
以下持有:
更新:
我正在使用{-# LANGUAGE OverloadedStrings #-}
.
perl - 如何计算多个序列的重叠二聚体?
我必须使用 Perl 计算多个序列中重叠二聚体(AA、AG、AC、AT、GA、GG、GC、GT、CC、CG、CA、CT、TT、TA、TG、TC)的数量。我编写了以下代码,但它仅适用于一个序列。如何将其扩展到多个序列?
我需要:
- 每个序列的计数和
- 总数
输入示例:sample.txt
python - 将范围元组列表折叠到重叠范围中
我正在寻找解决此问题的内存效率最高的方法。
我有一个表示句子中部分字符串匹配的元组列表:
每个元组的第一个值是匹配的开始位置,第二个值是长度。
这个想法是折叠列表,以便只报告最长的连续字符串匹配。在这种情况下,它将是:
我不想要最长的范围,就像在算法中找到最长的非重叠序列一样,但我希望所有的范围都被最长的折叠。
如果您想知道,我正在使用 Aho-Corasick 的纯 python 实现来将静态字典中的术语与给定的文本片段匹配。
编辑:由于这些元组列表的性质,重叠但不是独立的范围应该单独打印出来。例如,在字典中有单词betaz
andzeta
的匹配项betazeta
是[(0,5),(4,8)]
。由于这些范围重叠,但没有包含在另一个范围内,因此答案应该是[(0,5),(4,8)]
。我还修改了上面的输入数据集,以便涵盖这种情况。
谢谢!
r - 在 2 个文件之间寻找重叠值
我有 2 个数据集,每个数据集都包含 Start、End 和 Chromosome 列名。我想比较两个文件中的值,看看是否有任何不重叠的区域(考虑到开始、结束和色度位置)并使用 R 将它们包含在列表中。什么是遍历所有文件的最佳方法两个文件中的数据点并进行比较
文件示例 1:
文件示例 2:
谢谢