6

我需要将一堆 HTML 文件(大约 30 个)转换为 PDF。如果我可以创建目录和链接页面会很棒,但现在我很乐意转换单个文件:)

我已经尝试了几种解决方案,最成功的是 EO.PDF,但它在每一页上都放了一个讨厌的水印,它无法处理超过几兆的文件,我的一些是 10 兆以上。

我已经阅读了很多关于 wkhtmltopdf 的好东西,并且我找到了它的包装器 WkHTMLToSharp。我找不到任何文档,所以我拼凑了以下代码,这是抛出异常。我将不胜感激任何帮助解决这个问题。

我注意到导致异常的行。(非常无用的)例外是:

"The type initializer for 'WkHtmlToXSharp.WkHtmlToPdfConverter' threw an exception."

- 代码 -

/// <summary>
/// Creates a PDF file from the HTML file passed in
/// </summary>
/// <param name="cFile">Full path to HTML file to generate PDF from</param>
/// <param name="pdfFile">Full path of PDF output file</param>
public static void WritePDF(string cFile, string pdfFile)
{
    // Generates "The type initializer for 
    // 'WkHtmlToXSharp.WkHtmlToPdfConverter' threw an exception.":
    WkHtmlToPdfConverter w = new WkHtmlToPdfConverter();  

    byte[] strHTML = w.Convert(cFile);
    File.WriteAllBytes(pdfFile, strHTML);
    w.Dispose();
}

在解决了缺少 DLL 的问题后,我发现那段代码实际上转换了 HTML 字符串,而不是文件。我可以使用它,但更喜欢使用 HTML 文件。

此外,PDF 文件中没有显示任何图像。它们都是 JPG(我知道 GIFS 存在问题)。

4

2 回答 2

2

使用 WkHtmlToXSharp。

从 Github 下载最新的 DLL

public static string ConvertHTMLtoPDF(string htmlFullPath, string pageSize, string orientation)
{
   string pdfUrl = htmlFullPath.Replace(".html", ".pdf");

   try
   {
       #region USING WkHtmlToXSharp.dll
       //IHtmlToPdfConverter converter = new WkHtmlToPdfConverter();
       IHtmlToPdfConverter converter = new MultiplexingConverter();

       converter.GlobalSettings.Margin.Top = "0cm";
       converter.GlobalSettings.Margin.Bottom = "0cm";
       converter.GlobalSettings.Margin.Left = "0cm";
       converter.GlobalSettings.Margin.Right = "0cm";
       converter.GlobalSettings.Orientation = (PdfOrientation)Enum.Parse(typeof(PdfOrientation), orientation);
       if (!string.IsNullOrEmpty(pageSize))
           converter.GlobalSettings.Size.PageSize = (PdfPageSize)Enum.Parse(typeof(PdfPageSize), pageSize);

       converter.ObjectSettings.Page = htmlFullPath;
       converter.ObjectSettings.Web.EnablePlugins = true;
       converter.ObjectSettings.Web.EnableJavascript = true;
       converter.ObjectSettings.Web.Background = true;
       converter.ObjectSettings.Web.LoadImages = true;
       converter.ObjectSettings.Load.LoadErrorHandling = LoadErrorHandlingType.ignore;

       Byte[] bufferPDF = converter.Convert();

       System.IO.File.WriteAllBytes(pdfUrl, bufferPDF);

       converter.Dispose();

       #endregion
   }
   catch (Exception ex)
   {
       throw new Exception(ex.Message, ex);
   }

   return pdfUrl;
}
于 2013-10-31T04:03:10.687 回答
1

我想添加一个替代建议:不要使用 WkHtmlToXSharp - 而是安装 wkhtmltopdf 并直接使用它。在我看来,c#.net 中的生成过程非常简单,因此它是一个可行的替代方案。

我使用该方法并已成功将其推荐给其他人,请参阅我给出的较早答案。我仍然发现我在那里使用的例子是一个很好的例子,所以我会重复它。

var pi = new ProcessStartInfo(@"c:\wkhtmltopdf\wkhtmltopdf.exe");
pi.CreateNoWindow = true;
pi.UseShellExecute = false;
pi.WorkingDirectory = @"c:\wkhtmltopdf\";
pi.Arguments = "http://www.google.com gogl.pdf";

using (var process = Process.Start(pi))
{
    process.WaitForExit(99999);
    Debug.WriteLine(process.ExitCode);
}
于 2012-12-18T13:43:13.650 回答