0

我试图忽略网址的主机名部分,只保留路径。

例如:

http://bar.foooo.com/path1/path2/path3

目前我有以下正则表达式:

\\bhttp\\b)*(\\bhttps\\b)*(\\b[\\w']{1,2}\\b)*(\\bwww\\b)*(\\bco\\b)*(\\buk\\b)*(\\bcom\\b)*(\\borg\\b)*[^\\p{L}\\p{N}]+|[\\w\\d']{20,}|\\b\\w*\\d\\w*", " "));

这会将链接变为:

bar foooo path1 path2 path3

但我也想排除 bar 和 foooo 换句话说忽略 [http://bar.foooo.com/]

4

2 回答 2

0
^https?:\/\/[^\/]+\/(.+)$

应该管用。

于 2012-04-19T19:59:50.977 回答
0

你可以使用这个表达式:

^https?:\/\/[^\/]\/(.*)$

它将忽略起始http://....../(或https://....../)并且只会返回路径

于 2012-04-19T17:24:34.960 回答