0

我目前有一个脚本可以抓取 yahoo 等以提取链接。它正在工作但是我试图爆炸并摆脱链接和/最后的http://(任何东西之后/以及)。

if ($href->getAttribute('class') == 'yschttl spt') {
                $link = explode('?', urldecode(array_pop(explode('**', $href->getAttribute('href')))));
                $urls[] = $link[0];
            }

我以前没有真正使用过explode,所以我只是以某种方式删除了整条线。上面的示例返回所有 url:

http://finance.yahoo.com/q

例如。但是我需要它返回:

财务.yahoo.com

我正在使用来自http://aroussi.com/freebies/scraper/dl/fus1.zip的代码

4

0 回答 0