Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
<h1>我想编写一个捕获标签内容的正则表达式。
<h1>
例如我想捕获
<h1>All of this in here no matter what 雷 א 格 ןןד i$ </h1>
但是我不想要实际的<h1>标签,只想要里面的东西(包括外来字符)
周围有很多非常复杂的答案,有特殊条件、环顾四周、组。我正在寻找标签的内容。而已。
使用这个正则表达式模式
(?<=<h1>).*?(?=<\\/h1>)
你可以String#replaceAll这样使用:
String#replaceAll
String h1text = html.replaceAll("(?ui)<h1>(.*?)</h1>", "$1");
注意?u处理 unicode 字符和?i忽略大小写匹配。
?u
?i