因此,我尝试使用如下脚本从字符串中获取所有 url:
$file = file_get_contents('something.txt');
function getUrls($string) {
preg_match_all('~href=("|\')(.*?)\1~', $string, $out);
print_r($out);
}
getUrls($file);
本文档中包含的 url 可能不完善 - 即“/blah/blah.asp?2”。问题是当我运行这个脚本时,我得到一个看起来像这样的数组:
Array
(
[0] => Array
(
[0] => href="#A"
[1] => href="#B"
[2] => href="#C"
)
[1] => Array
(
[0] => "
[1] => "
[2] => "
)
[2] => Array
(
[0] => #A
[1] => #B
[2] => #C
)
)
知道这里会发生什么吗?我不知道为什么它返回带有井号而不是所需网址的字母列表。我怎样才能只返回网址?