1

我正在尝试使用正则表达式来解析网址。

url的格式可以是这样的

yadayadahttp://www.theurl.com/apage
yadayadahttp://www.theurl.com/yadayadahttp
://www.theurl.com
yadayadahttp://meow.theurl.com/apage
yadayadahttp://theurl.com
yadayadahttp: //theurl.com/

这是我的两个正则表达式来处理有和没有 www(或任何其他子域)。

www 正则表达式:

    \bhttp:\/\/\b\w*[a-z0-9]\.\w*[a-z0-9]\.\w*[a-z0-9]

和非 www 正则表达式:

    \bhttp:\/\/\b\w*[a-z0-9]\.\w*[a-z0-9]

有没有办法把它们结合起来?我知道有,但我似乎做不到。我已经尝试了几个小时了。

他们似乎也返回了空匹配项,这给了我的列表不必要的项目,是否可以返回不为空的匹配项?

4

2 回答 2

2

这可能对你有用..

\bhttp:\/\/(\b\w*[a-z0-9]\.)?\w*[a-z0-9]\.\w*[a-z0-9]
于 2012-09-18T22:15:58.730 回答
0

以下可能会做到这一点:

\bhttp:\/\/([\w\d\-\.]+\.)?[\w\d\-\.]+\.[\w\d]+\/?
于 2012-09-18T22:12:38.217 回答