我目前有一个脚本可以抓取 yahoo 等以提取链接。它正在工作但是我试图爆炸并摆脱链接和/最后的http://(任何东西之后/以及)。
if ($href->getAttribute('class') == 'yschttl spt') {
$link = explode('?', urldecode(array_pop(explode('**', $href->getAttribute('href')))));
$urls[] = $link[0];
}
我以前没有真正使用过explode,所以我只是以某种方式删除了整条线。上面的示例返回所有 url:
例如。但是我需要它返回:
财务.yahoo.com