所以基本上我正在做的是:我有一些文本,我需要从中获取 url。这是我正在使用的确切正则表达式:
http(s)?://([\w-]+\.[\w-]+)([/\.[\w-]+])*([a-zA-Z0-9\~\!\@\#\$\%\^\&\*\(\)_\-\=\+\\\/\?\.\:\;\'\,]*)?
问题是它也匹配诸如http://ex.ample"之类的 URL。等等。我只需要http://ex.ample部分。
所以我需要更新正则表达式,使 url 不能以以下字符结尾:
."()'<>;
AND 不包含以下字符序列之一:
"
'
>
<
我坚持了2天。谢谢!