问题标签 [xmlworker]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
802 浏览

c# - 带有 xmlworker 5.5.3 与 5.5.7 的 itextsharp 在最新版本上缺少波兰语字符

目前我使用的是 5.5.3 版本,它可以正常工作,但我尝试更新到最新版本,但我遇到了波兰语字符的问题(它们只是丢失了)。我进行从 rtf 到 html 以及从 html 到 pdf 的转换,如下所示:

它像在 5.5.3 上一样工作。我尝试调查,发现它们之间有一个区别(5.5.3 与 5.5.7):在字体 BaseFont 内的元素中的每个块上,它不仅为空:({itextSharp.text.pdf.TrueTypeFontUnicode})

图片

在 5.5.7 版上,BaseFont 为空。

我只使用 Century Gothic 字体(在 html 中)(在 FontFactory 中注册)。

让它在新版本中工作缺少什么?

0 投票
1 回答
2790 浏览

pdf - 带有 CE 字符的 iText XMLWorkerHelper 字体

我在使用 iText XMLWorkerHelper 将 HTML 转换为 PDF 时遇到了麻烦。文档生成良好,但最终没有一些中欧字符(克罗地亚字母,如 č、ć、đ、ž)。

当我在没有 XMLWorkerHelper 的情况下编写文本并定义字体时,databese 中的相同文本被正确写入:

但是当我使用 XMLWorkerHelper CE 时,字符会丢失。

如何将 CE 字体嵌入 PDF 文档并将其设置为 XMLWorkerHelper 的默认字体?

0 投票
0 回答
89 浏览

pdf-generation - IText“智能感知”

我需要一些指导来实现以下提到的目标。

  1. 开发可以在 Windows Server 2012 上作为计划作业运行的东西,可以将 HTML 文件转换为 PDF。我们曾经使用 Omniformat,但在迁移到 Windows Server 2012 后,这不再是一个选项,因为它只会卡在那里。

  2. 我使用 iText 做了一些 POC,看起来很有希望,除了以下几点:如果样式没有指定字体系列,IE 将正确呈现它,但 IText 只会打印一个空块。这发生在我的带有阿拉伯语和俄语字符的测试用例中。

到目前为止我所做的。

  1. 我想我必须有一个定制的 TagProcessor。

    公共类 MyParaGraph 扩展 ParaGraph {

    /li>

HTMLPDFConverter.java 主要:

阿拉伯文和俄文未显示在 PDF 中。感谢任何建议。对不起,我无法从开发中复制和粘贴我的 POC 代码,因为它们位于不同的网络上。谢谢

0 投票
0 回答
1989 浏览

c# - iTextSharp - xmlworker - html 解析器问题 - 尝试从 HTML 生成 PDF 时自动删除输入标签的结束标签

我有以下 HTML。看input tag下面comment(问题的真正原因)。


而不是input tag我试图去<asp:TextBox ID="TextBox2" runat="server"></asp:TextBox>


错误

找到无效的嵌套标记 td,预期结束标记输入

问题原因

但是当我看到解析的 html 时,我可以清楚地知道它以某种方式删除/并生成<input type="text>.

<asp:textbox>它相同删除结束标签并生成

<input name="ctl00$MainContent$TextBox2" id="MainContent_TextBox2" type="text">

请帮忙。

编辑帖子:

0 投票
1 回答
3028 浏览

java - IText 使用 XML Worker 防止跨多个页面的行中断

我们将 iText 5.5.7 与 XML Worker 一起使用,并且遇到了长表的问题,其中从页面末尾运行的行被分成两部分到下一页(见图)。

我们已尝试按照使用iText、XMLWorkeriText 在 HTML 表中的 PDF 页面之间剪切page-break-inside:avoid;防止文本块中的分页符中的建议使用,但没有效果。

我们已经尝试过

  • 将每一行包装在 a 中<tbody>并应用分页符避免(无效)
  • 定位tr, td和应用分页符(无效)
  • 将每个内容包装td在 a 中div并应用分页符(itext 一旦到达页面末尾就会停止处理行)

我们的印象page-break-inside:avoid是得到支持,但尚未看到对此的确认。是否有使用 XML 工作者创建此效果的示例或最佳实践,或者是否需要 Java api 来执行此级别的操作?

干杯

当前跨页面拆分的行:

行溢出到下一页(见红色轮廓)

期望的效果:数据过多的行换行到下一页 期望的结果,如果太长,行会中断到下一页(见绿色轮廓)

0 投票
1 回答
3574 浏览

c# - iTextSharp 创建带有空白页的 PDF

我刚刚将 iTextSharp XMLWorker nuget 包(及其依赖项)添加到我的项目中,并且我正在尝试将 HTML 从字符串转换为 PDF 文件,即使没有抛出异常,PDF 文件也正在生成两个空白页。为什么?

以前版本的代码仅使用带有 HTMLWorker 和 ParseList 方法的 iTextSharp 5.5.8.0,然后我切换到

这是我正在使用的代码:

如果我在第二页呈现段落document.Add(new Paragraph("Just a test"));之前放置,但文档的其余部分仍然是空白的。document.Close();

更新

我已将htmlString变量中的 HTML 更改为 aDIV和 aTABLE并且它起作用了。所以,现在问题变成了:我怎么知道 HTML 的哪一部分导致了 XMLWorker 中的一些错误?

0 投票
2 回答
11029 浏览

pdf - 如何使用 iText 将带有图像和超链接的 HTML 转换为 PDF?

我正在尝试在同时使用MVCWeb 表单的Web 应用程序中转换HTMLPDF使用 iTextSharp 。and元素具有绝对和相对URL,其中一些元素是base64。SO 和 Google 搜索结果中的典型答案使用通用代码,看起来像这样:ASP.NET <img><a><img>HTMLPDFXMLWorkerHelper

所以像这样的样本HTML

生成的 PDF:(1)缺少所有图像,并且(2)具有相对 URL 的所有超链接都已损坏,并且使用文件 URI 方案( file///XXX...) 而不是指向正确的网站。

SO的一些答案和谷歌搜索的其他答案建议用绝对URL替换相对URL,这对于一次性情况是完全可以接受的。但是,对于这个问题,用硬编码字符串全局替换 all<img src>和attributes 是不可接受的,所以请不要发布这样的答案,因为它会因此被否决。<a href>

我正在寻找一种适用于测试、开发和生产环境中的许多不同 Web 应用程序的解决方案。

0 投票
0 回答
68 浏览

pdf-generation - 从 html 创建 pdf 时出现问题

我想将多个 html 转换为一个 PDF。我使用以下代码创建 pdf 。此代码正在创建一个没有内容的空 PDF。

0 投票
1 回答
531 浏览

c# - iTextsharp - XmlWorker PDF - 在 PDF 中可见

我正在使用 iTextSharp XMLWorkder 类将 HTML 转换为 PDF。一切正常,除非那里有任何空的 HTML 表,它将"&#160;"字符放入其中,然后在 PDF 中清晰可见。

我试图用空白空间或替换<br/>它,但它给出了错误“表格​​宽度必须大于零”。

有人可以建议我该怎么做吗?

0 投票
2 回答
29252 浏览

c# - Using itextsharp xmlworker to convert html to pdf and write text vertically

Is there possible to achieve writing text direction bottom-up in xmlworker? I would like to use it in table. My code is

But it it doesn't work after conversion from html to pdf. Text FIRST and SECOND are not in direction bottom-to-up.