$match = q(<a href="#google"><h1><b>Google</b></h1></a>);
if($match =~ /<a.*?href.*?><.?>(.*?)<\/a>/){
$title = $1;
}else {
$title="";
}
print"$title";
输出:Google</b></h1>
它应该是 :Google
无法在 Perl 中使用正则表达式从链接中提取值,它可能有或多或少的嵌套:
<h1><b><i>Google</i></b></h1>
请试试这个:
1) <td><a href="/wiki/Unix_shell" title="Unix shell">Unix shell</a>
2) <a href="http://www.hp.com"><h1><b>惠普</b></h1></a>
3) <a href="/wiki/Generic_programming" title="通用编程">通用</a></td>);
4) <a href="#cite_note-1"><span>[</span>1<span>]</span></a>
输出:
Unix 外壳
生命值
通用的
[1]