问题标签 [xmlworker]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 带有 xmlworker 5.5.3 与 5.5.7 的 itextsharp 在最新版本上缺少波兰语字符
目前我使用的是 5.5.3 版本,它可以正常工作,但我尝试更新到最新版本,但我遇到了波兰语字符的问题(它们只是丢失了)。我进行从 rtf 到 html 以及从 html 到 pdf 的转换,如下所示:
它像在 5.5.3 上一样工作。我尝试调查,发现它们之间有一个区别(5.5.3 与 5.5.7):在字体 BaseFont 内的元素中的每个块上,它不仅为空:({itextSharp.text.pdf.TrueTypeFontUnicode})
在 5.5.7 版上,BaseFont 为空。
我只使用 Century Gothic 字体(在 html 中)(在 FontFactory 中注册)。
让它在新版本中工作缺少什么?
pdf - 带有 CE 字符的 iText XMLWorkerHelper 字体
我在使用 iText XMLWorkerHelper 将 HTML 转换为 PDF 时遇到了麻烦。文档生成良好,但最终没有一些中欧字符(克罗地亚字母,如 č、ć、đ、ž)。
当我在没有 XMLWorkerHelper 的情况下编写文本并定义字体时,databese 中的相同文本被正确写入:
但是当我使用 XMLWorkerHelper CE 时,字符会丢失。
如何将 CE 字体嵌入 PDF 文档并将其设置为 XMLWorkerHelper 的默认字体?
pdf-generation - IText“智能感知”
我需要一些指导来实现以下提到的目标。
开发可以在 Windows Server 2012 上作为计划作业运行的东西,可以将 HTML 文件转换为 PDF。我们曾经使用 Omniformat,但在迁移到 Windows Server 2012 后,这不再是一个选项,因为它只会卡在那里。
我使用 iText 做了一些 POC,看起来很有希望,除了以下几点:如果样式没有指定字体系列,IE 将正确呈现它,但 IText 只会打印一个空块。这发生在我的带有阿拉伯语和俄语字符的测试用例中。
到目前为止我所做的。
我想我必须有一个定制的 TagProcessor。
公共类 MyParaGraph 扩展 ParaGraph {
/li>
HTMLPDFConverter.java 主要:
阿拉伯文和俄文未显示在 PDF 中。感谢任何建议。对不起,我无法从开发中复制和粘贴我的 POC 代码,因为它们位于不同的网络上。谢谢
c# - iTextSharp - xmlworker - html 解析器问题 - 尝试从 HTML 生成 PDF 时自动删除输入标签的结束标签
我有以下 HTML。看input tag
下面comment
(问题的真正原因)。
而不是input tag
我试图去<asp:TextBox ID="TextBox2" runat="server"></asp:TextBox>
错误
找到无效的嵌套标记 td,预期结束标记输入
问题原因
但是当我看到解析的 html 时,我可以清楚地知道它以某种方式删除/
并生成<input type="text>
.
与<asp:textbox>
它相同删除结束标签并生成
<input name="ctl00$MainContent$TextBox2" id="MainContent_TextBox2" type="text">
请帮忙。
编辑帖子:
java - IText 使用 XML Worker 防止跨多个页面的行中断
我们将 iText 5.5.7 与 XML Worker 一起使用,并且遇到了长表的问题,其中从页面末尾运行的行被分成两部分到下一页(见图)。
我们已尝试按照使用iText、XMLWorker和iText 在 HTML 表中的 PDF 页面之间剪切page-break-inside:avoid;
防止文本块中的分页符中的建议使用,但没有效果。
我们已经尝试过
- 将每一行包装在 a 中
<tbody>
并应用分页符避免(无效) - 定位
tr, td
和应用分页符(无效) - 将每个内容包装
td
在 a 中div
并应用分页符(itext 一旦到达页面末尾就会停止处理行)
我们的印象page-break-inside:avoid
是得到支持,但尚未看到对此的确认。是否有使用 XML 工作者创建此效果的示例或最佳实践,或者是否需要 Java api 来执行此级别的操作?
干杯
当前跨页面拆分的行:
c# - iTextSharp 创建带有空白页的 PDF
我刚刚将 iTextSharp XMLWorker nuget 包(及其依赖项)添加到我的项目中,并且我正在尝试将 HTML 从字符串转换为 PDF 文件,即使没有抛出异常,PDF 文件也正在生成两个空白页。为什么?
以前版本的代码仅使用带有 HTMLWorker 和 ParseList 方法的 iTextSharp 5.5.8.0,然后我切换到
这是我正在使用的代码:
如果我在第二页呈现段落document.Add(new Paragraph("Just a test"));
之前放置,但文档的其余部分仍然是空白的。document.Close();
更新
我已将htmlString
变量中的 HTML 更改为 aDIV
和 aTABLE
并且它起作用了。所以,现在问题变成了:我怎么知道 HTML 的哪一部分导致了 XMLWorker 中的一些错误?
pdf - 如何使用 iText 将带有图像和超链接的 HTML 转换为 PDF?
我正在尝试在同时使用MVC和Web 表单的Web 应用程序中转换HTML
为PDF
使用 iTextSharp 。and元素具有绝对和相对URL,其中一些元素是base64。SO 和 Google 搜索结果中的典型答案使用通用代码,看起来像这样:ASP.NET
<img>
<a>
<img>
HTML
PDF
XMLWorkerHelper
所以像这样的样本HTML
:
生成的 PDF:(1)缺少所有图像,并且(2)具有相对 URL 的所有超链接都已损坏,并且使用文件 URI 方案( file///XXX...
) 而不是指向正确的网站。
SO的一些答案和谷歌搜索的其他答案建议用绝对URL替换相对URL,这对于一次性情况是完全可以接受的。但是,对于这个问题,用硬编码字符串全局替换 all<img src>
和attributes 是不可接受的,所以请不要发布这样的答案,因为它会因此被否决。<a href>
我正在寻找一种适用于测试、开发和生产环境中的许多不同 Web 应用程序的解决方案。
pdf-generation - 从 html 创建 pdf 时出现问题
我想将多个 html 转换为一个 PDF。我使用以下代码创建 pdf 。此代码正在创建一个没有内容的空 PDF。
c# - iTextsharp - XmlWorker PDF - 在 PDF 中可见
我正在使用 iTextSharp XMLWorkder 类将 HTML 转换为 PDF。一切正常,除非那里有任何空的 HTML 表,它将" "
字符放入其中,然后在 PDF 中清晰可见。
我试图用空白空间或替换<br/>
它,但它给出了错误“表格宽度必须大于零”。
有人可以建议我该怎么做吗?
c# - Using itextsharp xmlworker to convert html to pdf and write text vertically
Is there possible to achieve writing text direction bottom-up in xmlworker? I would like to use it in table. My code is
But it it doesn't work after conversion from html to pdf. Text FIRST and SECOND are not in direction bottom-to-up.