这是一个非常有趣的问题,所以对该问题+1。
第一步是查找 iTextSharp XML Worker 是否支持该HTML
td
标签。映射可以在iTextSharp.tool.xml.html.Tags的源代码中找到。在那里你会发现td
映射到iTextSharp.tool.xml.html.table.TableData,这使得实现自定义标签处理器的工作更容易一些。即我们需要做的就是从类继承和覆盖End()
:
public class TableDataProcessor : TableData
{
/*
* a **very** simple implementation of the CSS writing-mode property:
* https://developer.mozilla.org/en-US/docs/Web/CSS/writing-mode
*/
bool HasWritingMode(IDictionary<string, string> attributeMap)
{
bool hasStyle = attributeMap.ContainsKey("style");
return hasStyle
&& attributeMap["style"].Split(new char[] { ';' })
.Where(x => x.StartsWith("writing-mode:"))
.Count() > 0
? true : false;
}
public override IList<IElement> End(
IWorkerContext ctx,
Tag tag,
IList<IElement> currentContent)
{
var cells = base.End(ctx, tag, currentContent);
var attributeMap = tag.Attributes;
if (HasWritingMode(attributeMap))
{
var pdfPCell = (PdfPCell) cells[0];
// **always** 'sideways-lr'
pdfPCell.Rotation = 90;
}
return cells;
}
}
如内联注释中所述,这是一个非常简单的实现,可以满足您的特定需求。您需要添加额外的逻辑来支持任何其他写入模式 CSS
属性值,并包括任何健全性检查。
更新
根据@Daniel留下的评论,尚不清楚在CSS
转换为时如何添加自定义。首先更新的HTML:HTML
PDF
string XHTML = @"
<h1>Table with Vertical Text</h1>
<table><tr>
<td style='writing-mode:sideways-lr;text-align:center;width:40px;'>First</td>
<td style='writing-mode:sideways-lr;text-align:center;width:40px;'>Second</td></tr>
<tr><td style='text-align:center'>1</td>
<td style='text-align:center'>2</td></tr></table>
<h1>Table <u>without</u> Vertical Text</h1>
<table width='50%'>
<tr><td class='light-yellow'>0</td></tr>
<tr><td>1</td></tr>
<tr><td class='light-yellow'>2</td></tr>
<tr><td>3</td></tr>
</table>";
然后是一小段自定义 CSS:
string CSS = @"
body {font-size: 12px;}
table {border-collapse:collapse; margin:8px;}
.light-yellow {background-color:#ffff99;}
td {border:1px solid #ccc;padding:4px;}
";
XMLWorkerHelper.GetInstance().ParseXHtml()
稍微困难的部分是额外的设置 - 您不能使用SO 上常见的开箱即用的简单设置。这是一个简单的帮助方法,可以帮助您入门:
public void ConvertHtmlToPdf(string xHtml, string css)
{
using (var stream = new FileStream(OUTPUT_FILE, FileMode.Create))
{
using (var document = new Document())
{
var writer = PdfWriter.GetInstance(document, stream);
document.Open();
// instantiate custom tag processor and add to `HtmlPipelineContext`.
var tagProcessorFactory = Tags.GetHtmlTagProcessorFactory();
tagProcessorFactory.AddProcessor(
new TableDataProcessor(),
new string[] { HTML.Tag.TD }
);
var htmlPipelineContext = new HtmlPipelineContext(null);
htmlPipelineContext.SetTagFactory(tagProcessorFactory);
var pdfWriterPipeline = new PdfWriterPipeline(document, writer);
var htmlPipeline = new HtmlPipeline(htmlPipelineContext, pdfWriterPipeline);
// get an ICssResolver and add the custom CSS
var cssResolver = XMLWorkerHelper.GetInstance().GetDefaultCssResolver(true);
cssResolver.AddCss(css, "utf-8", true);
var cssResolverPipeline = new CssResolverPipeline(
cssResolver, htmlPipeline
);
var worker = new XMLWorker(cssResolverPipeline, true);
var parser = new XMLParser(worker);
using (var stringReader = new StringReader(xHtml))
{
parser.Parse(stringReader);
}
}
}
}
不要重新解释上面的示例代码,而是查看文档(iText 已删除文档,链接到 Wayback Machine)以更好地了解为什么需要以这种方式设置解析器。
另请注意:
- XML Worker不支持所有 CSS2/CSS3 属性,因此您可能需要试验哪些方法有效,哪些方法无效,以了解您希望 PDF 与浏览器中显示的 HTML 的接近程度。
- 该
HTML
片段删除了p
标签,因为样式可以直接应用于td
标签。
- 内联
width
属性。如果省略,列将是可变宽度,如果文本已被水平呈现,则匹配。
使用 iTextSharp 和 XML Worker 版本 5.5.9 测试以下是更新后的结果: