xml - REGEX 在 XML 中搜索和查找

Question

我正在开发博客/新闻聚合器，我认为需要一些正则表达式解析方面的帮助：P

我需要能够在 ~ 中找到 // 和第一个 / 之后的内容，<link>以便我可以正确显示源 URL。我怎么做？

<link>http://www.arabdemocracy.com/2012/09/syria-enter-worst-case-scenario.html</link>

score 1 · Accepted Answer

使用以下模式，您可以实现您所需要的（在您给出的输入字符串的列表中）：

<(\w+?)>[\w\W]+?//([\w\.]+?)/[\w\W]+?</\1>

要获得您需要的部分，请参阅第二个捕获组的内容...

无论如何请记住，正则表达式不是解析 HTML 的最佳选择...如果可以，请查看 HTML DOM 解析器库。

1 回答 1