好的,快速提问。我是 Java 的新手,我有一个任务,我必须从页面的标题标签中获取一个人的名字。我知道我的正则表达式,但我不能(或不知道如何)转义某些字符。
例子
<title>Mr. Somebody | Department in which he's in</title>
所以,基本上我需要一个可以让我成为“某人先生”的正则表达式。我试过了 :
Pattern pat = Pattern.compile("<title>(.+?)|");
Matcher mat = pat.matcher(data);
boolean found = false;
while (!found && mat.find()) {
name = mat.group(0);
found = true;
}
System.out.println("Found a name : " + name);
我的问题是,无论我尝试过什么,我最多只能得到第一个角色。您认为使用 indexOf 和子字符串的更简单的方法会更好,还是正则表达式仍然可行?
我知道通常正则表达式不适合解析 html 标签,但我认为这个搜索更多的是字符串搜索,因为我对整个标签(或可能包含在其中的其他标签)不感兴趣。
非常感谢任何形式的帮助:)