问题标签 [html-to-pdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2104 浏览

c# - 使用 ExpertPDF 从 HTML 生成的 PDF 的质量差异

我正在使用 ExpertPDF HtmlToPdf 转换器通过我的 ASMX Web 服务生成 PDF。但是质量很差,并且随着同一台机器上的 Windows 窗体版本而异。我使用该库的代码在两个应用程序中完全相同。

有什么不同?

样品:

使用 .NET Web 服务生成的 PDF(Windows Server 2008,ExpertPDF 版本 8): 使用 .NET Web 服务生成的 PDF(Windows Server 2008,ExpertPDF 版本 8)

使用 Windows 窗体应用程序生成的 PDF(Windows Server 2008,ExpertPDF 版本 8): 使用 Windows 窗体应用程序生成的 PDF(Windows Server 2008,ExpertPDF 版本 8)

0 投票
2 回答
10982 浏览

pdf-generation - wkhtmltopdf版本,首页和TOC

关于这个非常漂亮的工具的一些问题,不幸的是缺少许多使用示例。

  1. 手册谈到了 wkhtmltopdf 可能的“减少功能”。我有 version wkhtmltox-0.11.0_rc1-installer.exe,通过运行wkhtmltopdf --version 我应该阅读什么来了解我的版本是否是缩减版?
  2. 目前我喜欢 wkhtmltopdf 用于我想稍后阅读和/或存储的网页。为了镜像网页,我使用 httrack,然后使用wkhtmltopdf *.html offline.pdf. 如何设置/指定 *.html 列表中的第一个 PDF 页面?目前,它们似乎按字母顺序转换。
  3. 如果我运行,wkhtmltopdf toc http://qt-project.org/doc/qt-4.8/qstring.html qstring.pdf我只会得到一个领先的空白页,没有 TOC。怎么了?

感谢您的帮助

编辑:

@Nenotlep:

您的 TOC 技巧非常有效。

至于第一页,我不需要实际的封面。我需要的是一种将给定页面 www.site.com/foo.html 和所有链接页面(A.html,B.html ...)下载/转换到一定深度级别的方法。然后我想要一个以 foo.html 开头并包含页面 A.html、B.html ...(带有相对链接)的 PDF。

我认为没有选项可以下载并在最终 PDF 中插入链接页面(如果我错了,请纠正我)。所以我用httrack.com下载和wkhtmltopdf来转换。鉴于 wkhtmltopdf 的字母顺序行为,现在最好的方法似乎是重命名目标页面,使用 httrack 下载,类似于!foo.html. 请让我知道可能的替代方案。

0 投票
1 回答
2971 浏览

c# - 客户端发现响应内容类型为“application/pdf”,但预期为“text/xml”。请求失败并显示错误消息:

大家好,我已经在网络服务http://www.hiqpdf.com/demo/ConvertHtmlToPdf.aspx中编写了这段代码,如下所示

我从本地主机将其作为参考添加到我的项目中,但是在尝试转换时,我遇到了异常,因为Client found response content type of 'application/pdf', but expected 'text/xml'. The request failed with the error message:有人可以帮助我。

0 投票
2 回答
884 浏览

php - 在 Windows 上使用 PHP Wrapper 类将 HTML 转换为 PDF,打印错误问题

我无法让 PrinceXML 在我的 Windows Server 上工作。我正在使用 PHP 包装类,虽然我找不到任何有用的文档!

此处的 README 文件(在下载中)中提供的信息没有解释正在做什么,也没有提供任何示例代码。

到目前为止,这是我汇总的内容(非常基本),但没有打印任何内容,也没有显示任何错误。

我知道我没有包括在内header('PDF HEADERS HERE'),这仅仅是因为我想在打印 PDF 之前查看 PHP 错误是什么。

我用上面的代码玩了很多,但我尝试过的绝对没有任何工作。即使我将路径更改为prince.exe,也不会返回错误!为什么??

我的问题是:

  1. 如何打印遇到的错误?
  2. 是否有任何网站为此类提供了良好的文档?
0 投票
1 回答
15770 浏览

php - 使用 FPDF 将网页导出为 PDF

一个(希望)简单答案的复杂问题。

我正在研究 FPDF 以将网页导出为 PDF。该网页已针对打印媒体进行了格式化,但由于打印媒体可能与 CSS/HTML 渲染对象有点不确定,我希望导出为 PDF 然后打印会减少设计上的麻烦。

我浏览了 FPDF 网站,但没有看到我希望看到的功能。某种include()功能。我看到一堆关于格式化内容的行,我希望这意味着

我是不是想太多了?我可以简单地include()在 FPDF 构造函数之后使用,然后将其中的任何内容与页面一起打印吗?

0 投票
2 回答
4270 浏览

c# - 在 asp.net 中不使用 itextsharp.dll 将 HTML 页面转换为 PDF

我正在使用带有 C# 的 asp.net。我想将我的 html 页面转换为 pdf。但我不想同样使用“itextsharp.dll”。

我去了很多谷歌和网站。我正在寻找一些免费的。

0 投票
1 回答
1407 浏览

xslt - 使用 XSL FO 的 HTML 到 PDF 存在分页问题 - 仅显示第一页

我正在使用一个 Java 类(http://pastebin.com/KhSGPmCV),它接收一个 HTML 文档并尝试通过以下步骤将其转换为 PDF 文档:

  1. 使用 Tidy 将其解析为 XML 文档。
  2. 使用 XSLT 样式表 ( http://pastebin.com/s45gRTKy ) 将 xml 转换为 FO 文档
  3. 使用 Apache FoP 将 FO 转换为 PDF 文档。

我面临的问题只是我的 HTML 文档的第一页被转换为 PDF。我看到的警告信息是 -

Mar 2, 2013 2:53:06 PM org.apache.fop.events.LoggingEventListener processEvent WARNING: Content overflows the viewport of an fo:block-container in block-progression direction by 350 millipoints. Content will be clipped. (See position 51:261)

我很确定问题出在我正在使用的 XSL FO 样式表中。但是,即使在此样式表中添加/修改了很多变量之后,我也无法使第二页可见。有人可以帮我吗?

链接到我尝试转换为 PDF 的 HTML - pastebin.com/iBLw8Pbv

0 投票
2 回答
6992 浏览

vb.net - Imports 'iTextSharp.text.SimpleTable' 错误中指定的命名空间或类型

我正在使用 Visual Studio Pro 2005 尝试访问 iTextSharp.dll 以将 HTML 转换为 PDF。问题是 VS 无法识别返回此消息的 DLL:

“在 Imports 'iTextSharp.text' 中指定的命名空间或类型不包含任何公共成员或找不到。确保命名空间或类型已定义并包含至少一个公共成员。确保导入的元素名称不”不要使用任何别名。”

这可以防止对我的 .Net VB 代码中的对象进行任何访问。iTextSharp 版本是我今天下载的 5.4.0。

问题在于所需的两个组件:

  • 导入 iTextSharp.text
  • 导入 iTextSharp.text.pdf

有任何想法吗?

0 投票
5 回答
30255 浏览

java - iText – HTML 到 PDF – 图像不显示在 PDF 中

我有一个带有文本、图像的 html 页面,我正在将 HTML 内容解析为 iText 以生成 PDF。在生成的 PDF 中,未显示包含的图像,仅显示文本。

如果我通过像D:/Deiva/CRs/HTMLPage/article-101-horz.jpg这样的绝对路径,那么图像将被打印出来。但是如果我尝试从服务器打印图像

http://localhost:8085/content/dam/article-101-h1.jpg or http://www.google.co.in/intl/en_ALL/images/logos/images_logo_lg.gif

那么它不会被打印在 PDF 中。

注意:我使用itextpdf-5.2.1.jar来生成 PDF。

我的 HTML 代码(Article.html):

我正在使用以下 java 代码生成 PDF:

请提出以 PDF 格式显示图像的解决方案。

提前致谢。

天神

0 投票
1 回答
5173 浏览

c# - 将 html 文本导出为 PDF(带有内联样式)。背景颜色不起作用

我正在开发一个将 html 数据导出到 pdf 文件(在 c# 中)的应用程序。我按照这些步骤来转换数据

让我们假设我的文字是否类似于

问题是内部跨度标记的转换失败。它不会background-color从样式解析。我怎样才能做到这一点?我不想使用任何第三方工具。