我需要将 PDF 文档转换为 HTML 并在编辑 html 之后将此 HTML 转换为 PDF 。我使用 'pdftohtml' ubuntu 命令(pdftohtml - 将 pdf 文件转换为 html、xml 和 png 图像的程序),如下面的 PHP 代码
<?php $output = shell_exec('pdftohtml create.pdf updated.html'); ?>
它成功转换了整个文档,但它在页面顶部传递了所有图像。谁能帮我做这份工作?
我需要将 PDF 文档转换为 HTML 并在编辑 html 之后将此 HTML 转换为 PDF 。我使用 'pdftohtml' ubuntu 命令(pdftohtml - 将 pdf 文件转换为 html、xml 和 png 图像的程序),如下面的 PHP 代码
<?php $output = shell_exec('pdftohtml create.pdf updated.html'); ?>
它成功转换了整个文档,但它在页面顶部传递了所有图像。谁能帮我做这份工作?
您可以使用“-layout”标志PDF
在转换后的文件中保留原始文件的文档布局(页眉、页脚、分页等) 。html
$output = shell_exec('pdftohtml -layout create.pdf updated.html');
如果您只想转换PDF
文件中的一系列页面,请使用“-f”和“-l”(小写“L”)标志来指定要转换的范围内的第一页和最后一页。
$output = shell_exec('pdftohtml -f 5 -l 9 create.pdf updated.html');
要转换PDF
使用所有者密码保护和加密的文件,请使用“-opw”标志(标志中的第一个字符是小写字母“O”,而不是零)。
$output = shell_exec('pdftohtml -opw ‘password’ create.pdf updated.html');