0

我需要从这样的示例中提取一个在每个新页面上都会更改的地址。所以我需要一个正则表达式从下面的 html 代码片段中提取 100 E Faith Ter。

<span style="..." class="addr">100 E Faith Ter<br>
    <span class="locality">Maitland</span>,
    <span class="region">FL</span>
    <span class="postal-code">32751</span>
</span>

我正在使用 Javascript。

4

2 回答 2

0

您没有指定语言,并且正则表达式与语言完全无关,但它们在指定如何处理多行方面有所不同。在 javascript 中:/^.*$/m选择第一行。

将您的问题更新为完整的 HTML 而不是原始文本后,您可以使用:

^\<.+?\>(.+?)\<br\>$

并检索第一个带括号的子匹配(确保使用多行选项)

于 2013-02-02T04:58:27.510 回答
0

他来的小马!!

整个事情都不需要正则表达式。相反,只需使用剥离所有 HTML 标记 - 如果您使用的是 PHP,strip_tags则可以很好地执行此操作,否则您可以使用正则表达式将其替换<[^>]+>为空字符串。您应该得到地址的纯文本。然后,您可以将其拆分为单独的行。

或者你可能只是这个人:

xkcd

于 2013-02-02T04:59:39.493 回答