-3

我需要一个字符串来选择所有 html 标记文本编号的所有内容,除了在锚点结束标记中找到的单词的随机出现之外,这一行rel="bookmark">RANDOM WORDS</a></h1>

我尝试了[<0-9a-zA-z/=|"-:.*?>]选择字面上所有内容的字符串,它发现没关系,但我需要一个排除随机词的字符串,在上面提到的行中找到的选择中。

4

1 回答 1

1

正则表达式不是这项工作的正确工具。请考虑使用 XML/HTML DOM 解析器并以这种方式提取您需要的信息!

您在制作 RegEx 来完成此任务时遇到问题的原因是 HTML 标记语言不是正则- 因此,不适合使用正则表达式进行处理!

于 2013-02-20T16:27:31.673 回答