我正在尝试在 Perl 中下载网页的内容(公式)。我使用“LWP::UserAgent”模块来解析内容并注意检查 UTF8 格式。代码如下:
use LWP::UserAgent;
my $ua = new LWP::UserAgent;
my $response = $ua->get('http://www.abc.org/patent/formulae');
my $content =$response->decoded_content();
if (utf8::is_utf8($content))
{
binmode STDOUT,':utf8';
}
else
{
binmode STDOUT,':raw';
}
print $content;
但我仍然得到宽字符,输出如下:
#10; "
而我想要:
"Fromula = Ï Ì â¡ ( c + / c 0 ) â 1 "
我们怎样才能避免呢?