0

我想使用 C# 获取网页的标题。所以我请求该页面并获取响应页面并使用正则表达式来提取标题。

字符串正则表达式 = @"(?<=)([\s\S]*)(?=)/";

但我看到一个网站有两个标题,例如

<title>Page Title</title>
<link href="...."/>
<title>Page Title</title>

所以当我使用上面的正则表达式时,我得到的标题为

Page Title</title><link href="...."/><title>Page Title

我知道正则表达式是贪婪的。如何将正则表达式修改为不贪婪,以便它给我“页面标题”?

4

2 回答 2

5

为了不贪婪*,你可以使用*?

于 2010-08-24T17:11:08.137 回答
2
(?<=(<\s*title\s*>))((\s|\S)*?)(?=<\s*\/\s*title\s*>)
于 2010-08-24T21:00:35.890 回答