问题标签 [string-matching]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
22 回答
145754 浏览

javascript - 用于检查 IP 地址的 javascript 正则表达式

我有几个 IP 地址,例如:

  1. 115.42.150.37
  2. 115.42.150.38
  3. 115.42.150.50

如果我想搜索所有 3 个 ip 地址,我应该写什么类型的正则表达式?例如,如果我这样做115.42.150.*(我将能够搜索所有 3 个 IP 地址)

我现在可以做的是:/[0-9]{1-3}\.[0-9]{1-3}\.[0-9]{1-3}\.[0-9]{1-3}/但它似乎不能很好地工作。

谢谢。

0 投票
3 回答
11534 浏览

iphone - 字符串匹配objective-c

我需要以这种方式匹配我的字符串:*myString* 其中*意味着任何子字符串。我应该使用哪种方法?

你能帮我吗?

0 投票
1 回答
515 浏览

algorithm - 将一组短语分类为一组相似的短语

我有一些应用程序可以生成文本跟踪信息(日志)以记录文件。跟踪信息是典型的 printf() 样式 - 即有很多类似的日志条目(与 printf 相同的格式参数),但在格式字符串有参数的地方不同。

什么是一种算法(网址、书籍、文章……),它可以让我分析日志条目并将它们分类到几个箱/容器中,每个箱都有一个关联的格式?
本质上,我想要将原始日志条目转换为 (formatA, arg0 ... argN) 实例,其中 formatA 在许多日志条目之间共享。formatA 不必是用于生成条目的确切格式(如果这使算法更简单,则更是如此)。

我发现的大多数文献和网络信息都涉及精确匹配、最大子字符串匹配或 k 差异(k 提前已知/固定)。此外,它侧重于匹配一对(长)字符串或单个 bin 输出(所有输入中的一个匹配)。我的情况有些不同,因为我必须发现什么代表(足够好)匹配(通常是一系列不连续的字符串),然后将每个输入条目分类为发现的匹配之一。

最后,我不是在寻找完美的算法,而是在寻找简单/易于维护的东西。

谢谢!

0 投票
1 回答
3065 浏览

https - 允许通过 HTTPS 使用 iptables、-m 最近(可能)和 -m 字符串(绝对)连接到特定 URL

假设,例如,我只想允许连接subdomain.mydomain.com;我让它部分工作,但是一旦允许客户端问候,它有时会与客户端密钥交换进入一个怪异的循环。啊,更烦人的是,它是一个自签名证书,并且页面需要身份验证,并且 HTTPS 正在侦听非标准端口……所以 TCP/SSL 握手体验对于许多用户来说会有很大差异。

-m 最近是正确的路线吗?一旦看到字符串,是否有更优雅的方法来允许完整的 TCP 流?

这是我到目前为止所拥有的:

是的,我试图通过 nginx 调整来解决这个问题,但我无法让 nginx 在客户端打好之前返回 444,如果你能想出一种方法来实现这一点,我会全神贯注,错误,眼睛.

0 投票
3 回答
307 浏览

javascript - 获取页面上与 url 字符串匹配的所有链接

我目前正在使用此代码(与 Mootools 一起)来构建#subnavdiv 中包含特定 url 字符串的所有锚点的数组:

$('subnav').getElements('a[href*=/'+href+']')

问题是,如果我正在寻找work.aspx?subsection=24&project=1将与 URL 匹配的锚点work.aspx?subsection=24&project=15

我怎样才能防止这种情况发生?

0 投票
2 回答
744 浏览

python - Ruby 上的 difflib

在 Ruby 上是否有类似于 Python 的difflib的库?

特别是,我需要一个具有类似于difflib.get_close_matches的方法。有什么建议吗?

0 投票
2 回答
1396 浏览

python - 改进 Python 中的模糊匹配算法

任务:获取两个文本文件并输出 100% 匹配和 75% 匹配。

解决方案

问题:这行得通,但是结果不是很好。下面是一个匹配的例子:

我不能将 Diff 中的最低百分比提高太多,因为我需要能够将 Univ 与 University 相匹配。另外,我不能只确保第一个单词匹配,因为某些字符串以“The”开头,并且需要与排除“The”的字符串匹配。任何人都可以指出我的方向,它会抛出技术上 75% 相似但对人类根本不相似的匹配吗?

0 投票
1 回答
1482 浏览

java - 通过循环多项式散列 n-gram - java 实现

我正在解决一些涉及 Rabin–Karp 字符串搜索算法的问题。该算法要求滚动哈希比简单搜索更快。本文介绍如何实现滚动哈希。我没有问题地实现了“Rabin-Karp rolling hash”,发现很少有实现实现,但文章还提到了计算复杂性,并且首选通过循环多项式对 n-gram 进行散列。它链接到这种技术的BuzHash实现,但我想知道如何使用它在其之上构建 n-gram 哈希。我想要这样的东西

对于java。

对于会遇到与字符串搜索相关的问题的人(比如我),我发现一些文章很有1、2、3

0 投票
3 回答
10200 浏览

php - String similarity in PHP: levenshtein like function for long strings

The function levenshtein in PHP works on strings with maximum length 255. What are good alternatives to compute a similarity score of sentences in PHP.

Basically I have a database of sentences, and I want to find approximate duplicates. similar_text function is not giving me expected results. What is the easiest way for me to detect similar sentences like below:

0 投票
4 回答
12066 浏览

c# - Regex Pattern Matching: Using only the start and end of a pattern for matching

Hi I am really struggling with this problem;

I am trying to use regex to match the start and end of a pattern where the middle of the pattern can change. So I would like to use a regex expression that will match the start which is constant and the end which is constant can anyone help?

For instance the start of the pattern is "/>" and ends with "abc"

I am using c#.

Thanks