我有同事从事 .NET 1.1 项目,他们从外部获取 XML 文件,并以编程方式指示 iTextSharp 基于 XML 数据生成 PDF 内容。
棘手的部分是,在这个 XML 中是任意 HTML 内容的片段。这些是用户从其 Office 应用程序复制和粘贴的 HTML 代码。在 Web 浏览器上看起来仍然不错,但是当将此 HTML 输入 iTextSharp 的 HTMLWorker 对象以解析并转换为 PDF 对象时,格式和对齐会在生成的 PDF 文档中到处运行。例如
<span id="mceBoundaryType" class="portrait"></span>
<table border="0" cellspacing="0" cellpadding="0" width="636" class="MsoNormalTable"
style="margin: auto auto auto 4.65pt; width: 477pt; border-collapse: collapse">
<tbody>
<tr style="height: 15.75pt">
<td width="468" valign="bottom" style="padding-right: 5.4pt; padding-left: 5.4pt;
padding-bottom: 0in; width: 351pt; padding-top: 0in; height: 15.75pt; background-color: transparent;
border: #ece9d8">
<p style="margin: 0in 0in 0pt" class="MsoNormal">
<font face="Times New Roman"> </font></p>
</td>
<td colspan="3" width="168" valign="bottom" style="padding-right: 5.4pt; padding-left: 5.4pt;
padding-bottom: 0in; width: 1.75in; padding-top: 0in; height: 15.75pt; background-color: transparent;
border: #ece9d8">
<p style="margin: 0in 0in 0pt; text-align: center" class="MsoNormal" align="center">
<u><font face="Times New Roman">Group</font></u></p>
</td>
</tr>
标签充满了 Style 属性,iTextSharp 不支持 CSS 和解释该属性。其他 iTextSharp 用户尝试解决此问题或其他可行的 HTML-to-PDF 组件有哪些替代方法?