我在 Perl 中的正则表达式有点问题。
假设我得到了一个字符串,其中嵌入了 URI。我想存储每个唯一的 URI。
我的问题是该字符串中的 URI 可能具有不同的格式。有些可能是mylightsaber24.com
,有些可能是,http://www.companyabc.co.uk
甚至是www.thisisawebsite.com/index.html?someparameters
。
出于这个原因,两者都Regexp::Common qw /URI/
让Regexp::Common qw/net/
我失望了:(
任何指针?
非常感谢!
用于识别的奖励积分www.nomansland.com
基本上nomansland.com
是相同的条目。