Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在开发博客/新闻聚合器,我认为需要一些正则表达式解析方面的帮助:P
我需要能够在 ~ 中找到 // 和第一个 / 之后的内容,<link>以便我可以正确显示源 URL。我怎么做?
<link>
<link>http://www.arabdemocracy.com/2012/09/syria-enter-worst-case-scenario.html</link>
使用以下模式,您可以实现您所需要的(在您给出的输入字符串的列表中):
<(\w+?)>[\w\W]+?//([\w\.]+?)/[\w\W]+?</\1>
要获得您需要的部分,请参阅第二个捕获组的内容...
无论如何请记住,正则表达式不是解析 HTML 的最佳选择...如果可以,请查看 HTML DOM 解析器库。