我能够在 Windows 8.1 + Xampp 上安装 TET (php_tet.dll),并且我对 PDF 到文本没有任何问题,但我在图像提取方面没有运气。
我正在使用示例“image resources.php”(和“image_extractor.php”),它应该在 PDF 文件中“打印”有关图像(x、y、宽度、高度、alpha 等)的一些信息。还必须将所有可用(或任何)图像保存/提取到文件(tiff、jpg)中。
这些例子可以在这里找到:http: //goo.gl/ZeDlc0
带有图像信息的部分正在工作,但没有提取文件。
我在将文本提取到同一文件夹中的 TXT 文件时没有遇到任何问题。所以我可以在那里写吗?
我的 SEARCHPATH 有什么问题吗?
我的尝试:
原始示例抛出错误:
Error 1016 in open_document(): Couldn't open PDF file 'FontReporter.pdf' for reading (file not found)
所以我改变了搜索路径:
/* global option list */
$globaloptlist = "searchpath={{../data} {../../data} }";
与我的 pdf 文件的位置:
/* global option list */
$globaloptlist = "searchpath={{D:\Workshop\www\TET\data} }";
现在我通过 print/echo 获得了一些输出数据:
page 7: 208x277pt, alpha=0, beta=0 id=0, 595x750 pixel, 1x8 bit Indexed
page 7: 208x277pt, alpha=0, beta=0 id=1, 595x750 pixel, 1x8 bit Indexed
$tet->write_image_file方法返回 10 表示" I can extract TIFF file"。
但是在我的pdf`s文件夹或周围的任何地方都没有提取图像......