3

我正在尝试阅读 pdf 文件的内容。这是代码

 4 use warnings;
 5 use strict;
 6
 7 use PDF;
 8
 9 print "*" x 30, "\n";
10 my $filename = shift;
11 print "Filename: $filename\n";
12
13 my $pdf = PDF->new($filename);

这是输出:

******************************
Filename: Calabasas, LA County June 2012 monthly-new-projects-report.pdf
Can't read cross-reference section, according to trailer

当我浏览谷歌时,我发现这与文件损坏有关。但我仍然可以用 pdf 阅读器打开它。

我应该尝试不同的 Perl 模块还是我的代码坏了?

4

1 回答 1

0

不知道这是否是您正在寻找的(纯 perl 解决方案或 Windows 解决方案),但在 Unix 中,我调用“pdftotext”为我进行转换,然后我阅读了文件:

open IN, '-|', '/usr/bin/pdftotext', $file, '-' 
    or die "couldn't open $file $!\n";

希望能帮助到你!

于 2012-08-16T14:05:47.910 回答