8

我有以下代码:

    function parse() {
        $content = file_get_contents($this->feed);        
        $rss = new SimpleXmlElement($content);
        $rss_split = array();
        $i = 0;
        foreach ($rss->channel->item as $item) {
            $title = (string) $item->title; // Title
            $link = (string) $item->link; // Url Link            
            $content = $item->children('content', true)->encoded;
            preg_match('/<img.+src=[\'"](?P<src>.+)[\'"].*>/i', $content, $image);
            $image = substr($image['src'], 0, strpos($image['src'], '"'));
            $rss_split[$i]['title'] = $title;
            $rss_split[$i]['link'] = $link;
            $rss_split[$i]['image'] = $image;
            $i++;
        }
        return $rss_split;
    }

在这里,$this->feed包含 RSS 提要的 URL。问题是我不知道如何验证 URL 以确保它是有效的 RSS 提要。

4

3 回答 3

15

要验证它是 XML:

function parse()
{
    $content = file_get_contents($this->feed); 
    try { $rss = new SimpleXmlElement($content); }
    catch(Exception $e){ /* the data provided is not valid XML */ return false; }
    // rest of your function goes here

确认它是 XML 后,您有几个选择:

  1. 您可以检查以确保isset($rss->channel->item)存在并且$rss->channel->item->count()> 0。
  2. 您可以使用count($rss->xpath(/channel/item)) > 0.

我个人会使用 xpath,因为我在阅读代码时发现它更明显一些。


边注:

严重地?您已经获得了 XML 对象。你为什么使用正则表达式?

不要这样做:

preg_match('/<img.+src=[\'"](?P<src>.+)[\'"].*>/i', $content, $image);

当这是一个有效选项时:

$g = $item->xpath('//img'); $g[0]->attributes()->src;
于 2012-10-08T05:56:05.043 回答
1

愿这对你有所帮助。

?php

function validateFeed( $sFeedURL )
{

$sValidator = 'http://feedvalidator.org/check.cgi?url=';

if( $sValidationResponse = @file_get_contents($sValidator . urlencode($sFeedURL)) )
{
    if( stristr( $sValidationResponse , 'This is a valid RSS feed' ) !== false )
    {
        return true;
    }
    else
    {
        return false;
    }
}
else
{
    return false;
}
}

?>
于 2012-10-08T05:49:51.563 回答
0

用这个

$rss = new SimpleXmlElement($content);
if($rss)
{
     //your code
}
else
{ return false; }
于 2012-10-08T05:49:41.577 回答