我正在尝试提取标题元素中的文本并忽略其他所有内容。
我看过这些文章,但它们似乎没有帮助:\
正则表达式提取方括号之间的文本
Java Java 正则表达式中的字符串模式匹配以
从 HTML 锚 (<a>...</a >) 标签
主要问题是我在尝试破解我自己的代码时无法理解响应者在说什么。
这是我通过阅读Pattern 文章中的 Java API 所获得的。
<title>(.*?)</title>
这是我返回标题的代码。
String title = null;
Matcher match = Pattern.compile("[<title>](.*?)[</title>]").matcher(this.webPage);
try{
title = match.group();
}
catch(IllegalStateException e)
{
e.printStackTrace();
}
我收到了 IllegalStateException,它是这样说的:
java.lang.IllegalStateException: No match found
at java.util.regex.Matcher.group(Matcher.java:485)
at java.util.regex.Matcher.group(Matcher.java:445)
at BrowserModal.getWebPageTitle(BrowserModal.java:21)
at BrowserTest.main(BrowserTest.java:7)
第 21 行将是“title = match.group();”