我正在使用 xpdf 将 pdf 文件转换为文本。下面是用于它的代码。
$content = shell_exec('pdftotext '.$filename.' -');
Xpdf 无法将 pdf 中的一些特殊字体转换为文本。例如:无法使用 xpdf 将奇异字体转换为文本。
它们是可以将pdf中的所有字体转换为PHP文本的替代软件吗?
我正在使用 xpdf 将 pdf 文件转换为文本。下面是用于它的代码。
$content = shell_exec('pdftotext '.$filename.' -');
Xpdf 无法将 pdf 中的一些特殊字体转换为文本。例如:无法使用 xpdf 将奇异字体转换为文本。
它们是可以将pdf中的所有字体转换为PHP文本的替代软件吗?
如果您的文件的 XPDF 版本失败,也许您应该尝试Poppler版本pdftotext
....
但是,请注意这一事实: 即使是 Acrobat Reader 也无法将 PDF 页面上所有渲染良好的文本提取到文本文件中...