Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我需要一个字符串来选择所有 html 标记文本编号的所有内容,除了在锚点结束标记中找到的单词的随机出现之外,这一行rel="bookmark">RANDOM WORDS</a></h1>
rel="bookmark">RANDOM WORDS</a></h1>
我尝试了[<0-9a-zA-z/=|"-:.*?>]选择字面上所有内容的字符串,它发现没关系,但我需要一个排除随机词的字符串,在上面提到的行中找到的选择中。
[<0-9a-zA-z/=|"-:.*?>]
正则表达式不是这项工作的正确工具。请考虑使用 XML/HTML DOM 解析器并以这种方式提取您需要的信息!
您在制作 RegEx 来完成此任务时遇到问题的原因是 HTML 标记语言不是正则- 因此,不适合使用正则表达式进行处理!