例如,在使用 (getElementsByTagName) 时是否可以删除不需要的文本。
这将为我的网站获取电影的发布日期
$spans = $dom->getElementsByTagName('span');
for($i=0; $i <$spans-> length; $i++){
$itemprop = $spans->item($i)->getAttribute("itemprop");
if ($itemprop == "datePublished"){
if ($spans->item($i)->textContent!='-'){
$res['published'] = trim($spans->item($i)->textContent);
}
}
}
但是发生的事情不是得到这个。
12 July 2011
相反,它得到了这个。
12 July 2011 10:47 PM, UTC
我可以添加任何代码来删除这部分也是如此。
10:47 PM, UTC