问题标签 [pdf-conversion]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2032 浏览

php - Symfony2 - How to convert doc or docx files to pdf

Is there any method in Symfony that converts MS word files (doc, docx) t pdf ? Any integrated function, bundle? What are your experience with?

Thank you in advance.

0 投票
2 回答
3020 浏览

excel - PDFCreator 和 Excel 查看器

我很想使用 PDFCreator 从 excel 文件(.xlsx)创建 PDF 文件。我无法使用 MS Office。

我已经下载了 PDFCreator 并尝试使用以下命令打印 .docx:

这个没问题,因为写字板用于将 .docx 文件发送到 PDFCreator。

我已经安装了 Microsoft Excel Viewer 来打开和打印 Excel 文件。当我打开 Excel Viewer 时,我可以使用 PDFCreator 作为虚拟打印机来打印 PDF。但是,当我尝试从命令行使用 PDFCreator 时:

没有任何反应 - 只显示带有文件选择的弹出窗口 - 我发现 Excel Viewer 显示此弹出窗口以打开特定文件。

我的问题是:

1)当 MS Office 不可用时,是否有任何选项可以从命令行使用 PDFCreator 打印 XLS 文件?

2) Excel Viewer 是否有任何命令行参数来打印文件?到目前为止,我有 XLVIEW.EXE "filename.xlsx"

要求:

  • 整个过程必须自动化(这就是我使用命令行参数的原因)

  • 无法使用 MS Office(由于许可证)

  • 免费用于商业用途/在服务器上使用

谢谢!

0 投票
1 回答
2490 浏览

java - 特殊字符未正确从 pdf 转换为文本

我有一组包含中欧字符的 pdf 文件,例如 č、Ď、Š 等。我想将它们转换为文本,我已经尝试pdftotextPDFBox通过 Apache Tika 但总是其中一些没有正确转换。

奇怪的是,同一文本中的相同字符在某些地方被正确转换,而在另一些地方则不正确!一个例子是这个pdf

在 pdftotext 的情况下,我使用这些选项:

我的 Tika 代码如下所示:

编辑:忘了提到我在从 Acrobat Reader XI 转换为文本时也面临同样的问题。

0 投票
1 回答
1397 浏览

node.js - 将node.js中的html文件转换为pdf并在磁盘中写入

在我的应用程序中,我有一个 html 模板,它从数据库中获取动态数据。我需要将该 html 文件(模板)转换为 PDF。是否有任何包可以在 node.js 中将原始 html 转换为 PDF?我使用 pdfcrowd 和 livedocx。两者都使用一些不适合我的规范的网络服务进行转换。请建议一些用于在本地机器中将 HTML 转换为 PDF 的软件包..?

0 投票
1 回答
49209 浏览

vba - PDF 到 Excel 转换将每个 pdf 页面放在不同的工作表中

我正在尝试将 pdf 文件(16 页)转换为 excel 文件,以便运行我在 excel 中已有的程序。我已经有一个将pdf转换为excel的代码,但是我希望宏将pdf文件的每个单独页面放在我的excel文件中的不同工作表中(目前它复制所有页面并粘贴pdf的第1页到工作表中)。

如果有帮助的话,所有页面都有相同的标题。我当前的代码包含在下面,在此先感谢。

0 投票
2 回答
3339 浏览

php - Zend PDF 编写 html 代码来代替文本

我成功地用函数测试了我的代码Zend_Pdf()以便于理解,这是我的代码:

我的鳕鱼将显示在 pdf 文件中

This is reporting for <br /> hello world: LALALA......

我的问题

我如何通过在其中编写标签 html 来解决这个问题,就像标签<br /> 应该知道的那样?请任何曾经了解它的人。任何帮助...

我期待很快看到你的回复。谢谢 。

0 投票
1 回答
4325 浏览

docx4j - 使用 docx4j 将 docx 转换为 pdf 的问题

我正在使用 docx4j 2.8.1 并尝试转换几个不同的 docx 文件,但我总是遇到同样的问题。问题可能来自库的版本或缺少某些依赖项。

代码:

错误:

0 投票
1 回答
1115 浏览

pdf - Docverter 在 markdown -> pdf 上丢失 utf-8 编码

当我尝试使用 Docverter(通过 API)将 utf-8 编码的 markdown 文件转换为 pdf 时,我只是丢失了非 ASCII 字符。

有什么解决办法吗?

我想转换 .md -> .pdf。也许 Docverter 可以帮助做 .md -> .html,然后我可以为 .html -> .pdf 使用其他一些库/服务?

0 投票
0 回答
3580 浏览

java - Java Poi XWPF 将 Docx 转换为 PDF DrawText 问题

我正在使用 Poi XWPF 将 docx 文件转换为 pdf,结果很好,但是缺少 DrawText,我该如何解决这个问题?

文本在pdf中消失

0 投票
4 回答
9792 浏览

ocr - 用于扫描文档(TIFF 和 PDF)的扫描仪的最佳设置

为了扫描文档(白色和黑色文本)并将它们用于 OCR 转换(以获得最佳效果),扫描仪的最佳设置是什么?PDF 和 TIFF 格式的标准设置和规范是什么?