0

我有一个链接列表,但我需要从字符串中过滤和提取正确的链接。

提取应以 mywebsite.com 开头,以 9-digitnumber.html 结尾链接是字符串,提取为字符串

例子

http://blah.com?f=www.mywebsite.com/sdfsf/sdfsdf/sdfsdfsdf/123456789.html&sdfsdf/sf/sdfsd8sdfsdfsdf

等等...

由此,正则表达式必须提取

mywebsite.com/sdfsf/sdfsdf/sdfsdfsdf/123456789.html

这应该与末尾的数字 '@"[0-9]{9}" 匹配。但我对正则表达式很陌生,并试图学习如何正确使用它

4

2 回答 2

1

使用正则表达式解析 HTML 通常是个坏主意。对于您的特定示例,您可以使用:

(mywebsite.com/(.+?)\d{9})

但正如安德鲁所说,使用正则表达式来做你想做的事并不是真正必要的。

于 2012-05-05T19:52:39.693 回答
1
/mywebsite\.com\/[a-zA-Z0-9\/]*[0-9]{9}\.html/
于 2012-05-05T19:54:37.587 回答