我有一个项目,我需要在大量文本中查找字符串的出现。已知搜索字符串存在于较大的文本中,但是由于我无法控制的原因,它们不是正确的空格,因为它们在某些单词之间缺少空格。
例如,我要查找的字符串是(不是brown和fox之间缺少空格:
quick brownfox jumps
我需要在以下位置找到它:
The quick brown fox jumps over the lazy dog.
我需要能够修改干草堆以使用识别标签包装找到的术语,所以我最终会得到类似的东西:
The <span class="found">quick brown fox jumps</span> over the lazy dog.
我已经研究过在自由间距模式下使用正则表达式,这似乎不太符合我的需要,我考虑从搜索词中删除所有空格并在每个字符之间添加\s*但认为这可能会对性能产生可怕的影响(任何正则表达式专家都可以确认或否认吗?)。
是否有任何可能的非正则表达式解决方案可供研究。
谢谢