0

我正在阅读来自的 RSS 提要

$homepage = file_get_contents('http://feeds.cbsnews.com/CBSNewsWorld');

 $movies = new SimpleXMLElement($homepage);

我发现了这样的数据

    [item] => Array
            (
                [0] => SimpleXMLElement Object
                    (
                        [title] => Japan grants stricken nuke co. $11B for cleanup

                        [description] => Cash-strapped 
                        ....and more
                    )

我的问题是当我看到这个 URL 的页面源时,我发现了一个附加字段

 <feedburner:origLink>http://www.cbsnews.com/8301-202_162-57318337/girl-3-eats-leftovers-for-2-days-after-mom-dies/</feedburner:origLink>

但我在这个数组中看不到这个字段,我想把这个字段存储在我的数据库中。请建议...

4

1 回答 1

1

我发现了同样的问题。我所做的是修改所有 RSS 文件,效果很好(我每天访问数以千计的提要)。在你的情况下:

$homepage = file_get_contents('http://feeds.cbsnews.com/CBSNewsWorld');

//HACK: SimpleXmlParser don't works well with ':' in tags (like <feedburner:info>)
$homepage = preg_replace("/(<\/?)(\w+):([^>]*>)/", "$1$2$3", $homepage);

$movies = new SimpleXMLElement($homepage);

现在 feedburner:origLink 是 feedburnerorigLink

于 2011-11-04T10:57:49.960 回答