我希望在文本文件中搜索给定的单词,该单词可以选择在单词中的未知位置连字符并拆分为连续的行。
例如。匹配“连字符”内:
This sentence contains a hyphena-
ted word.
最接近(没有吸引力)的解决方案:
"h\(-\s*\n\s*\)\?y\(-\s*\n\s*\)\?p\(-\s*\n\s*\)\?h\(-\s*\n\s*\)\?e\(-\s*\n\s*\)\?n\(-\s*\n\s*\)\?a\(-\s*\n\s*\)\?t\(-\s*\n\s*\)\?e\(-\s*\n\s*\)\?d"
我希望一些比我强的 regex-foo 可以提出一个明确包含正在搜索的单词的正则表达式,即。我想在那里看到“连字符”。我还没有找到一种编码类似以下内容的方法(无论如何这都是错误的,因为它会匹配“hy-ted”):
"{prefix-of:hyphenated}{hyphen/linebreak}{suffix-of:hyphenated}"
我意识到预处理文档以折叠这些单词会使搜索更简单,但我正在寻找一个正则表达式,我可以在由于所涉及的工具而无法实现的上下文中使用它。