-1

<h1>我想编写一个捕获标签内容的正则表达式。

例如我想捕获

<h1>All of this in here no matter what 雷 א 格 ןןד i$ </h1>

但是我不想要实际的<h1>标签,只想要里面的东西(包括外来字符)

周围有很多非常复杂的答案,有特殊条件、环顾四周、组。我正在寻找标签的内容。而已。

4

2 回答 2

1

使用这个正则表达式模式

(?<=<h1>).*?(?=<\\/h1>)
于 2013-10-30T17:01:11.320 回答
0

你可以String#replaceAll这样使用:

String h1text = html.replaceAll("(?ui)<h1>(.*?)</h1>", "$1");

注意?u处理 unicode 字符和?i忽略大小写匹配。

于 2013-10-30T17:05:04.813 回答