从网站抓取静态 html 页面并将它们写入单个文件的 perl 脚本似乎可以工作,但也会打印许多实例wide character in print at ./script.pl line n
到控制台:每个抓取的页面都有一个。
然而,对生成的 html 文件的简要浏览并没有发现任何明显的抓取错误。如何找到/修复问题字符?我什至应该关心修复它吗?
相关代码:
use WWW::Mechanize;
my $mech = WWW::Mechanize->new;
...
foreach (@urls) {
$mech->get($_);
print FILE $mech->content; #MESSAGE REFERS TO THIS LINE
...
这是在带有 Perl 5.8.8 的 OSX 上。