我正在尝试在另一个答案中找到的东西,但我遇到了一些问题:
我知道 URL 有更好的正则表达式,但例如考虑一下:
@links=($content =~ m/(https?)?.*[.]com/g);
*$content has text or html
该部分(https?)?
用于链接之类www.google.com
的,但有括号返回"http"
到$1
其中@links
!这是一个问题,因为我想要整个链接。
什么会从文本中全局提取简单链接(或指定的任何正则表达式)并将它们放入列表中?
简单来说,我的意思是:
http://www.google.com
www.google.com
google.com
https://www.google.com