生成 PDF 时,TCPDF 似乎非常强大。由于很多事情都可以直接在TCPDF中完成,我想知道是否可以直接在TCPDF中将文本转换为图像。(或以某种方式保存 PDF,使机器无法轻松读取某些文本部分)
目标是提供一种垃圾邮件保护,使爬虫很难在不使用 OCR 技术的情况下从 PDF 文件中提取某些数据。
我能够从 PHP 中的文本创建图像并将它们插入到 TCPDF 中,但是直接在 TCPDF 中进行这种转换会更容易处理字体。
生成 PDF 时,TCPDF 似乎非常强大。由于很多事情都可以直接在TCPDF中完成,我想知道是否可以直接在TCPDF中将文本转换为图像。(或以某种方式保存 PDF,使机器无法轻松读取某些文本部分)
目标是提供一种垃圾邮件保护,使爬虫很难在不使用 OCR 技术的情况下从 PDF 文件中提取某些数据。
我能够从 PHP 中的文本创建图像并将它们插入到 TCPDF 中,但是直接在 TCPDF 中进行这种转换会更容易处理字体。
不,据我所知。我正在回答这个问题,因为 tcpdf 文档目前还不清楚,我也想知道。仅供参考,我所做的是使用 imagick (安装正确后直接)将 tcpdf pdf 输出转换为图像:
// from tcpdf...
$pdf_out = $pdf->Output($pdf_filename, 'S'); // returns pdf string
$imagick = new Imagick();
$imagick->setResolution($dpi,$dpi); // eg 300, 300
$imagick->readImageBlob($pdf_out);
$imagick->setImageFormat('pdf'); // for pdf use 'pdf'
$imagick->setImageCompressionQuality(60);
header('Content-type: application/pdf');
header('Content-Disposition: attachment; filename="' . $pdf_filename . '"');
echo $imagick; // put to broswer