我正在尝试使用 itextsharp XMLWorker 库将一些 HTML 解析为 PDF。它工作正常,但我无法将一些 Unicode 字符(土耳其语)渲染到我的 pdf 中。
我已经阅读了几个关于这个问题的博客,他们都建议注册一种支持 unicode 字符的字体。然后在外部 css 文件中,我需要指定要使用的字体系列。
html
{
font-family: 'Arial Unicode MS';
}
我也Arial
像家人一样尝试过。我也尝试在 html 中设置家庭。
<body face = 'Arial'>
他们都没有工作。字体注册没有问题,外部 CSS 文件也可以正常工作。
这就是我将 HTML 转换为 PDF 的方式,
string arialuniTff = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts), "ARIALUNI.TTF");
FontFactory.Register(arialuniTff);
// Resolve CSS
var cssResolver = new StyleAttrCSSResolver();
var cssFile = XMLWorkerHelper.GetCSS(new FileStream(Server.MapPath("~/Content/Editor.css"), FileMode.Open));
cssResolver.AddCss(cssFile);
// HTML
CssAppliers ca = new CssAppliersImpl();
HtmlPipelineContext hpc = new HtmlPipelineContext(ca);
hpc.SetTagFactory(Tags.GetHtmlTagProcessorFactory());
// PIPELINES
PdfWriterPipeline pdf = new PdfWriterPipeline(document, writer);
HtmlPipeline htmlPipe = new HtmlPipeline(hpc, pdf);
CssResolverPipeline css = new CssResolverPipeline(cssResolver, htmlPipe);
XMLWorker worker = new XMLWorker(css, true);
XMLParser p = new XMLParser(worker);
StringReader sr = new StringReader("<html><head></head><body>" + topMessage.Replace("<br>", "<br></br>") + "</body></html>");
p.Parse(sr);