我有一个项目,我需要解析一个 xml 页面并挑选一些数据。domDocument 类看起来很完美,我尝试了一些基本测试,看看它是否能达到我想要的效果。
这是我目前的代码:
$dom = new domDocument;
$html = file_get_contents('http://wadmag.com/feed.xml');
$previous_value = libxml_use_internal_errors(TRUE);
$dom->loadHTML("$html");
libxml_clear_errors(); //This here is to clear the errors caused by the page not
libxml_use_internal_errors($previous_value); // being proper html
$links = $dom->getElementsByTagName('item');
echo "Found : ".$links->length. " items";
foreach ($links as $link) {
echo $link->nodeValue."<br>";
}
现在的问题是,当我加载页面时,我收到消息“找到:21 个项目”,这意味着 getElementsByTagName 返回了一个列表,但是当我尝试显示列表的内容时,什么都没有显示,好像 nodeValue是空的。
更奇怪的是,如果我用标题或描述替换 getElementsByTagName 中的“链接”,它会按应有的方式显示所有内容。似乎无法理解为什么,我能看到的唯一区别是它可能是正确的 html 而不是。