0

我正在尝试使用 itextsharp XMLWorker 库将一些 HTML 解析为 PDF。它工作正常,但我无法将一些 Unicode 字符(土耳其语)渲染到我的 pdf 中。

我已经阅读了几个关于这个问题的博客,他们都建议注册一种支持 unicode 字符的字体。然后在外部 css 文件中,我需要指定要使用的字体系列。

html
{
    font-family: 'Arial Unicode MS';
}

我也Arial像家人一样尝试过。我也尝试在 html 中设置家庭。

<body face = 'Arial'>

他们都没有工作。字体注册没有问题,外部 CSS 文件也可以正常工作。

这就是我将 HTML 转换为 PDF 的方式,

string arialuniTff = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts), "ARIALUNI.TTF");
FontFactory.Register(arialuniTff);

// Resolve CSS
var cssResolver = new StyleAttrCSSResolver();
var cssFile = XMLWorkerHelper.GetCSS(new FileStream(Server.MapPath("~/Content/Editor.css"), FileMode.Open));
cssResolver.AddCss(cssFile);

// HTML
CssAppliers ca = new CssAppliersImpl();
HtmlPipelineContext hpc = new HtmlPipelineContext(ca);
hpc.SetTagFactory(Tags.GetHtmlTagProcessorFactory());

// PIPELINES
PdfWriterPipeline pdf = new PdfWriterPipeline(document, writer);
HtmlPipeline htmlPipe = new HtmlPipeline(hpc, pdf);
CssResolverPipeline css = new CssResolverPipeline(cssResolver, htmlPipe);

XMLWorker worker = new XMLWorker(css, true);
XMLParser p = new XMLParser(worker);
StringReader sr = new StringReader("<html><head></head><body>" + topMessage.Replace("<br>", "<br></br>") + "</body></html>");
p.Parse(sr);
4

2 回答 2

0

我看到您在CssAppliersImpl不使用参数的情况下创建了实例。如果你想处理字体,你应该创建一个“FontProvider”实现并使用该实现的一个实例作为CssAppliersImpl构造函数的参数。例如:创建一个TestFontProvider类,向您显示解析 HTML 时需要哪些字体名称。这将帮助您了解是否注册了正确的字体。如果您看到所有必需的字体都已注册,则问题可能是由其他原因引起的。例如:可能使用错误的编码解析 HTML...

于 2013-10-24T08:04:11.553 回答
0

经过多次尝试,这是可行的解决方案:

 string fontPath = Path.Combine(@"fonts\Gaegu-Regular.ttf");
 var fontProvider = new XMLWorkerFontProvider(XMLWorkerFontProvider.DONTLOOKFORFONTS);
 fontProvider.Register(fontPath);            
 CssAppliers ca = new CssAppliersImpl(fontProvider);
 HtmlPipelineContext htmlContext = new HtmlPipelineContext(ca);
 var pipeline = new CssResolverPipeline(cssResolver, new HtmlPipeline(htmlContext, new PdfWriterPipeline(document, writer)));

谢谢。

于 2018-07-12T06:38:49.367 回答