我正在尝试为我的网站制作类似功能的最新新闻。为此,我制作了一个网络爬虫,并且到目前为止通过执行以下操作能够从页面收集链接
$dom = new domDocument;
@$dom->loadHTML(file_get_contents($url));
$dom->preserveWhiteSpaces = false;
$linksToStore = $dom->getElementsByTagName('a');
foreach($linksToStore as $tag){
$links[$tag->getAttribute('href')]= $tag->childNodes->item(0)->nodeValue;
}
我如何从与特定域相关的链接指向的页面中获取内容,在我的情况下是“医疗”?