1

我是正则表达式的新手。我需要帮助。

我的 HTML 源代码是

<a  href="http://www.google.com"></a>
<img src ="planets.gif" width="145" height="126" alt="Planets" usemap ="#planetmap">
<map name="planetmap">
<area shape="rect" coords="0,0,82,126" href="http://www.sun.htm" alt="Sun">
<area shape="circle" coords="90,58,3" href="http://www.mercur.htm" alt="Mercury">
<area shape="circle" coords="124,58,8" href="http://www.www.venus.htm" alt="Venus">
</map>

我正在尝试提取所有 href 链接,例如http://www.google.com。请帮助。

我的正则表达式是

"href=[\\\"\\'](http:\\/\\/|\\.\\/|\\/)?\\w+(\\.\\w+)*(\\/\\w+(\\.\\w+)?)*(\\/|\\?\\w*=\\w*(&\\w*=\\w*)*)?[\\\"\\']"

它会像 href="http://www.google.com"

但我只需要http://www.google.com没有 链接href=

4

1 回答 1

1

请为这种东西使用 XML 解析器。

于 2013-05-24T08:59:44.727 回答