问题标签 [string-search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1159 浏览

c - 从 char 数组中获取当前单词的最有效方法

假设我有一个字符串“text”,一个插入符号位置“caret”,然后想要找到当前单词(以空格分隔)。

我目前这样做的方式似乎效率低下,我想知道是否有人有一种有效的方式来做到这一点?

0 投票
4 回答
6984 浏览

php - 使用特殊字符时,stripos 返回 false

我正在使用stripos 函数来检查一个字符串是否位于另一个字符串中,忽略任何情况。

这是问题所在:

返回假。尽管

返回真。

如您所见,在这种情况下,该函数似乎没有进行不区分大小写的搜索。

该函数对 Ææ 和 Åå 等字符有同样的问题。这些是丹麦字符。

0 投票
2 回答
9948 浏览

php - 字符串中的PHP数组值?

我一直在 PHP 手册中四处寻找,但找不到任何可以满足我要求的命令。

我有一个包含键和值的数组,例如:

然后我有一个字符串,例如:

现在我想知道是否有任何数组 ($Fields) 值与字符串 ($Headline) 中的某处匹配。

例子:

将给出结果为真,因为“bl”在字符串 $Headline 中(作为“Black”的一部分)。

我问是因为我需要性能......如果这是不可能的,我只会制作自己的功能......

编辑- 我正在寻找类似 stristr(string $haystack , array $needle);

谢谢

解决方案- 我想出了他的功能。

返回的数组现在有关于每个匹配单词的开始和结束位置的信息。

0 投票
2 回答
40016 浏览

algorithm - Boyer Moore 算法的理解和例子?

我在理解 Boyer Moore 字符串搜索算法方面遇到了问题。

我正在关注以下文档。关联

我无法弄清楚这里 delta1 和 delta2 的真正含义是什么,以及他们如何应用它来查找字符串搜索算法。语言看起来有点模糊..

如果有人可以帮助我理解这一点,那将非常有帮助。

或者,如果您知道任何其他易于理解的链接或可用文档,请分享。

提前致谢。

0 投票
4 回答
36485 浏览

c# - 搜索特定字符串并返回整行

我想做的是在文本文件中查找字符串的所有实例,然后将包含所述字符串的完整行添加到数组中。

例如:

例如,搜索 eng 必须将前两行添加到数组中,当然包括文件中更多的“eng”实例。

使用文本文件输入和 C# 如何做到这一点?

0 投票
2 回答
468 浏览

c# - 使用 MemoryMappedFile 对大型文本文件执行搜索是否有意义?

我的任务是实现一个搜索功能,该功能将搜索几个大型(几 MB)日志文件并返回包含关键字的行。日志文件不断添加到池中,因此每次搜索都必须是动态的。

为每个文件创建一个MemoryMappedFile然后遍历每一行,匹配关键字是否有意义?如果没有,有什么更好的方法来解决它?

任何指向示例代码的链接将不胜感激。

0 投票
7 回答
3068 浏览

php - 替换字符串中的重复字符串

我正在尝试在字符串中查找(并替换)重复的字符串。

我的字符串可能如下所示:

Lorem ipsum dolor sit amet sat amet sat amet sat nostrud exercitation amit sit ullamco laboris nisi ut aliquip ex ea commodo consequat。

这应该变成:

Lorem ipsum dolor sit amet sat nostrud exercitation amit sit ullamco laboris nisi ut aliquip ex ea commodo consequat。

请注意,由于没有重复,因此没有删除amit sat 。

或者字符串可以是这样的:

Lorem ipsum dolor sit amet () sat amet () sat amet () sat nostrud exercitation ullamco laboris nisi ut aliquip aliquip ex ea commodo consequat。

应该变成:

Lorem ipsum dolor sit amet () sit nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat。

所以它不仅是 az,还可以有其他(ascii)字符。如果有人可以帮助我,我很高兴。

下一步是匹配(和替换)如下内容:

2 个问题 3 个问题 4 个问题 5 个问题

这将成为:

2个问题

最终输出中的数字可以是任意数字 2,3,4,没关系。最后一个例子中只有不同的数字,但单词是相同的。

0 投票
2 回答
13384 浏览

python - 从python中的二进制文件中提取字符串

我有一个项目,我有一个文件,我需要从文件中提取字符串。基本上想到了linux中的“strings”命令,但我在python中这样做。下一个条件是文件作为流(例如字符串)提供给我,因此使用其中一个子进程函数来运行字符串的明显答案也不是一个选项。

我写了这段代码:

这在技术上有效,但速度很慢。例如,我能够在 500Meg 的可执行文件上使用 strings 命令,它在不到 1 秒的时间内生成了价值 300k 的字符串。我通过上面的代码运行了相同的文件,花了 16 分钟。

是否有一个库可以让我在没有 python 延迟负担的情况下做到这一点?

谢谢!

0 投票
7 回答
40744 浏览

php - 将外来字符更改为对应的罗马字符

我正在使用 php,我想知道是否有预定义的方法可以将外来字符转换为非外来字符。

ê、ë、é等字符都产生'e'
我正在寻找一个可以接受字符串并在没有特殊字符的情况下返回它的函数。
任何想法将不胜感激!

0 投票
3 回答
1771 浏览

objective-c - Objective-C 杂乱字母求解器

我正在尝试在给定 6 个字母的 iphone 上创建这个应用程序,它将输出所有可能的 3-6 个字母的英文单词。我已经有一本字典,我只想知道怎么做。

我四处搜索,只找到了那些在 python 中的拼字游戏求解器或那些单词搜索网格解决方案。

我认为蛮力搜索会做,但我担心性能。代码不是必需的,一个算法的链接或算法本身就可以了,我想我一旦得到它就可以管理。

谢谢!