我正在尝试在另一个答案中找到的东西,但我遇到了一些问题:
我知道 URL 有更好的正则表达式,但例如考虑一下:
@links=($content =~ m/(https?)?.*[.]com/g);
*$content has text or html
该部分(https?)?用于链接之类www.google.com的,但有括号返回"http"到$1其中@links!这是一个问题,因为我想要整个链接。
什么会从文本中全局提取简单链接(或指定的任何正则表达式)并将它们放入列表中?
简单来说,我的意思是:
http://www.google.comwww.google.comgoogle.comhttps://www.google.com