0

我正在开发博客/新闻聚合器,我认为需要一些正则表达式解析方面的帮助:P

我需要能够在 ~ 中找到 // 和第一个 / 之后的内容,<link>以便我可以正确显示源 URL。我怎么做?

<link>http://www.arabdemocracy.com/2012/09/syria-enter-worst-case-scenario.html</link>

4

1 回答 1

1

使用以下模式,您可以实现您所需要的(在您给出的输入字符串的列表中):

<(\w+?)>[\w\W]+?//([\w\.]+?)/[\w\W]+?</\1>

要获得您需要的部分,请参阅第二个捕获组的内容...

无论如何请记住,正则表达式不是解析 HTML 的最佳选择...如果可以,请查看 HTML DOM 解析器库。

于 2013-08-31T06:38:02.527 回答