0

我正在尝试从下面的 html 代码中获取 href 标记。这只是完整 html 的一部分。

<div class=\"adr\"><a title=\"8632 Open Meadow Way, Columbia, MD\" href=\"\/homedetails\/8632-Open-Meadow-Way-Columbia-MD-21045\/37058296_zpid\/\">8632 Open Meadow Way, Columbia, MD<\/a><\/div>

我尝试了很多方法,但没有运气。我正在寻找正则表达式。

请帮我。

4

3 回答 3

2
/href=\\"(.*?)\\"/  //substring should be capture group 1.

编辑:但是如果数据中有双引号怎么办?那么是双引号吗?那么你可以试试这个:

/href=\\"(""|.*?)\\"/
于 2012-03-07T08:06:24.927 回答
1

href不是标签,而是属性。其次,尽管如此,不要使用正则表达式来解析 HTML,这就是 DOM 的用途。您没有指定您使用的语言,如果它是 Javascript,则使用的正确函数是element.getAttribute()

于 2012-03-07T08:08:38.350 回答
0

当然,就是这个(根据您的平台进行必要的转义)。关键是 * 之后的最小数量量词,否则它将消耗直到最后一个可能的报价。

a\s+href="(.*?)"
于 2012-03-07T08:07:11.297 回答