0

我能够在 Windows 8.1 + Xampp 上安装 TET (php_tet.dll),并且我对 PDF 到文本没有任何问题,但我在图像提取方面没有运气。

我正在使用示例“image resources.php”(和“image_extractor.php”),它应该在 PDF 文件中“打印”有关图像(x、y、宽度、高度、alpha 等)的一些信息。还必须将所有可用(或任何)图像保存/提取到文件(tiff、jpg)中。

这些例子可以在这里找到:http: //goo.gl/ZeDlc0

带有图像信息的部分正在工作,但没有提取文件。

我在将文本提取到同一文件夹中的 TXT 文件时没有遇到任何问题。所以我可以在那里写吗?

我的 SEARCHPATH 有什么问题吗?

我的尝试:

原始示例抛出错误:

Error 1016 in open_document(): Couldn't open PDF file 'FontReporter.pdf' for reading (file not found)

所以我改变了搜索路径:

/* global option list */
$globaloptlist = "searchpath={{../data} {../../data} }";

与我的 pdf 文件的位置:

/* global option list */
$globaloptlist = "searchpath={{D:\Workshop\www\TET\data} }";

现在我通过 print/echo 获得了一些输出数据:

page 7: 208x277pt, alpha=0, beta=0 id=0, 595x750 pixel, 1x8 bit Indexed 
page 7: 208x277pt, alpha=0, beta=0 id=1, 595x750 pixel, 1x8 bit Indexed

$tet->write_image_file方法返回 10 表示" I can extract TIFF file"

但是在我的pdf`s文件夹或周围的任何地方都没有提取图像......

4

2 回答 2

0

这正是我在 TET 手册中找到的(第 3.9 章“PHP”部分):

File name handling in PHP 
Unqualified file names (without any path component) and relative file names are 
handled differently in Unix and Windows versions of PHP:
- PHP on Unix systems will find files without any path component in the directory
  where the script is located.
- PHP on Windows will find files without any path component only in the directory
  where the PHP DLL is located.

所以我想,预计您必须根据需要稍微调整样本。

于 2014-02-17T09:30:31.130 回答
0

不知何故,图像在 D:\workshop\xampp\apache 中导出

在选项文件名中,我需要设置绝对路径和文件名...

$path = str_replace('\\', '/', __DIR__);

$imageoptlist = $baseimageoptlist . " filename {".$path."/out/" .
    $outfilebase . "_p" . $pageno . "_I" . $ti->imageid . "}";

    if ($tet->write_image_file($doc, $ti->imageid, $imageoptlist) == 0){
       print("Error " . $tet->get_errnum() . " in " .
          $tet->get_apiname() . "(): " . $tet->get_errmsg());
 }
于 2014-02-16T13:26:57.643 回答