1

我在 Perl 中的正则表达式有点问题。

假设我得到了一个字符串,其中嵌入了 URI。我想存储每个唯一的 URI。

我的问题是该字符串中的 URI 可能具有不同的格式。有些可能是mylightsaber24.com,有些可能是,http://www.companyabc.co.uk甚至是www.thisisawebsite.com/index.html?someparameters

出于这个原因,两者都Regexp::Common qw /URI/Regexp::Common qw/net/我失望了:(

任何指针?

非常感谢!

用于识别的奖励积分www.nomansland.com基本上nomansland.com是相同的条目。

4

1 回答 1

1

这些 CPAN 模块是什么:

于 2012-06-19T08:13:52.383 回答