我正在尝试使用正则表达式来解析网址。
url的格式可以是这样的
yadayadahttp://www.theurl.com/apage
yadayadahttp://www.theurl.com/yadayadahttp
://www.theurl.com
yadayadahttp://meow.theurl.com/apage
yadayadahttp://theurl.com
yadayadahttp: //theurl.com/
这是我的两个正则表达式来处理有和没有 www(或任何其他子域)。
www 正则表达式:
\bhttp:\/\/\b\w*[a-z0-9]\.\w*[a-z0-9]\.\w*[a-z0-9]
和非 www 正则表达式:
\bhttp:\/\/\b\w*[a-z0-9]\.\w*[a-z0-9]
有没有办法把它们结合起来?我知道有,但我似乎做不到。我已经尝试了几个小时了。
他们似乎也返回了空匹配项,这给了我的列表不必要的项目,是否可以返回不为空的匹配项?