我正在使用 RedMon(重定向端口监视器)、HP 通用驱动程序 PS 和 GhostScript 来拦截文档打印。
但是,对于以下场景:
文件 PDF -> HP Universal Driver PS -> RedMon -> PostScript File** -> GhostScript 创建文件printed.pdf*。
* 无法从 PDF 文件中提取文本:gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=output.txtprinted.pdf
** PostScript 文件创建为压缩文件,无法提取文本。
问题是?
将 PDF 发送到打印机时,我可以在不压缩的情况下创建 PostScript 文件吗?
观察:Printed.pdf -> Image(TIFF) -> Tesseract(OCR) -> Text File... 有效!但它很慢。