我正在使用 ghostscript 8.71 从 PDF 页面中提取文本。
我正在使用的命令是:
gswin32c -q -sFONTPATH=c:\\fonts -dNODISPLAY -dSAFER -dDELAYBIND \
-dWRITESYSTEMDICT -dSIMPLE -fps2ascii.ps -dFirstPage=1 \
-dLastPage=1 input.pdf -dQUIET
我正在使用<stdout>
将文本定向到另一个文件。
但问题是 Ghostscript 无法提取一些可搜索的文本项。
某些字体文本未提取,例如:粗体字 Verdana。但是 Ghostscript 正在打开字体文件。
我可以上传 PDF 文件,但在这里我没有找到任何上传选项。如果有任何选项可用,请告诉我。