1

我正在努力从在线新闻报纸的 RSS 提要中获取特殊术语。我正在使用带有 LWP::UserAgent 的 XML::RSS::Parser 进行 URL 下载。我无法让它工作,即使我实际上使用来自 cpan 的复制粘贴:http : //search.cpan.org/~tima/XML-RSS-Parser-1.02/Parser.pm# $feed-%3Erss_namespace_uri . 我总是遇到同样的错误:“无法在 GetRss.pl 第 25 行的未定义值上调用方法“rss_namespace_uri””。我已经尝试了一切......我在使用 LWP::Simple 和 XML::RSS::Parser 时遇到了同样的问题,我使用 FileHandle 管理它,但我知道我想从多个站点获取提要,保存在大批。这是我的代码:

#!/usr/bin/perl -w

use strict;
use XML::RSS::Parser;
use URI;
use LWP::UserAgent;
use Data::Dumper;

my $ua = LWP::UserAgent->new;
$ua->agent('XML::RSS::Parser Test Script');
my @places=( 'http://www.timaoutloud.org/xml/index.rdf' );

my $p = new XML::RSS::Parser;

foreach my $place ( @places ) {

         # retreive feed
        my $url=URI->new($place);
        my $req=HTTP::Request->new;
        $req->method('GET');
        $req->uri($url);
        my $feed = $p->parse($ua->request($req)->content);

        # output some values
        my $title = XML::RSS::Parser->ns_qualify('title',$feed->rss_namespace_uri);
        print $feed->channel->type.": ".$feed->channel->element($title)->value."\n";
        print "item count: ".$feed->item_count()."\n";
        foreach my $i ( @{ $feed->items } ) {
                foreach ( keys %{ $i->element } ) {
                        print $_.": ".$i->element($_)->value."\n";
                        }
                        print "\n";
                }
                # data dump of the feed to screen.
                my $d = Data::Dumper->new([ $feed ]);
                print $d->Dump."\n\n";
        }

谢谢

4

1 回答 1

0

当您访问 Internet 上的资源时,此访问总是有可能失败。做错误管理:

my $response = $ua->get('http://search.cpan.org/');

if ($response->is_success) {
  print $response->decoded_content;  # or whatever
} else {
  die $response->status_line;
}

— 从LWP::UserAgent文档中窃取

注意使用decoded_content,这样更好。另外,请注意没有为简单的GET. 您将希望print用您的解析代码替换 。

当我尝试使用浏览器访问您提供的 URL 时,我超时了。

您还可以查看$p->parse返回的内容是否确实正常:

die "Couldn't parse feed" unless $feed;

另外,use warnings.

于 2013-01-24T15:48:09.110 回答