我有一个函数,它传递了一个 url 数组。每个网页都会有一系列指向其他页面的链接。我想从传递给此函数的每个网页返回这些链接的完整列表。我被困在如何在每个循环中组合数组。
function getitemurls ($pagelinks) {
global $host;
foreach($pagelinks as $link) {
$circdl = my_curl($link);
$circqp = htmlqp($circdl,'body');
$circlinks = array();
foreach ($circqp->branch()->top('area[href]') as $item) {
$circlinks[] = $item->attr('href');
}
for ($i = 0; $i < count($circlinks); ++$i) {
$fullitemurl = join(array($host,$circlinks[$i]));
}
}
return $fullitemurl;
}
例如:
Webpage 1: page1.html
<html><body><area shape="rect" href="http://www.google.com" coords="110,151,173,225" alt=""/></body></html>
Webpage 2: page2.html
<html><body><area shape="rect" href="http://www.yahoo.com" coords="110,151,173,225" alt=""/></body></html>
这是两个页面的数组:
$array = array (
"0" => "page1.html",
"1" => "page2.html", );
从这个数组我想返回:
getitemurls($array)
Array ( [0] => http://www.google.com [1] => http://www.yahoo.com)