0

我有一些代码使用 iTextSharp 的PdfSmartCopy类将多个较小的 PDF 文件合并为一个大文件:

FileStream outStream = new FileStream(outputFilename, FileMode.Create, FileAccess.Write);
Document document = new Document();
PdfSmartCopy copy = new PdfSmartCopy(document, outStream);
document.Open();

foreach (string filename in fileList)
{
   PdfReader reader = new PdfReader(filename);

   for (int pageNum = 1; pageNum <= reader.NumberOfPages; ++pageNum)
   {
      copy.AddPage(copy.GetImportedPage(reader, pageNum));
   }
}

document.Close();

当我使用 提取 PDF 的资源mutool extract时,它使用的每种字体都有多个相同的副本:

C:\[...]>sha1sum *.cff *.ttf *.png | sort
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0020.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0036.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0049.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0069.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0084.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0099.cff
17a99e597d3ec2cabf567cbfec032972f7e00962 *DXLQZY+LetterGothicW1Bold-0032.ttf
17a99e597d3ec2cabf567cbfec032972f7e00962 *GMYLDU+LetterGothicW1Bold-0014.ttf
17a99e597d3ec2cabf567cbfec032972f7e00962 *MNVLMO+LetterGothicW1Bold-0045.ttf
[etc.]

我检查了 FontForge 中的 *.cff 和 *.ttf 文件,看起来它们只包含文档中实际使用的字符子集。

有没有办法让生成的文件只包含一个字体副本?

4

1 回答 1

2

iText 和 iTextSharp 都可以将字体子集合并为一个子集。对于某些字体,制作这么大的子集可能是可行的,但在某些情况下,将不同的字体合并为一个是不可能的(理论上,对于非常大的字体集,例如中文),在其他情况下,这将非常困难(这可能意味着需要重写整个内容流,因为字符/字形映射在合并字体中发生了变化)。

换句话说:你在问一些不是微不足道的事情。不支持。这是我们只在付费咨询的情况下才考虑的那种功能。

于 2013-05-14T05:50:32.760 回答