regex - 我需要关于正则表达式字符串的帮助

Question

我需要一个字符串来选择所有 html 标记文本编号的所有内容，除了在锚点结束标记中找到的单词的随机出现之外，这一行rel="bookmark">RANDOM WORDS</a></h1>

我尝试了[<0-9a-zA-z/=|"-:.*?>]选择字面上所有内容的字符串，它发现没关系，但我需要一个排除随机词的字符串，在上面提到的行中找到的选择中。

score 1 · Accepted Answer

正则表达式不是这项工作的正确工具。请考虑使用 XML/HTML DOM 解析器并以这种方式提取您需要的信息！

您在制作 RegEx 来完成此任务时遇到问题的原因是 HTML 标记语言不是正则- 因此，不适合使用正则表达式进行处理！

1 回答 1