我有一些代码使用 iTextSharp 的PdfSmartCopy
类将多个较小的 PDF 文件合并为一个大文件:
FileStream outStream = new FileStream(outputFilename, FileMode.Create, FileAccess.Write);
Document document = new Document();
PdfSmartCopy copy = new PdfSmartCopy(document, outStream);
document.Open();
foreach (string filename in fileList)
{
PdfReader reader = new PdfReader(filename);
for (int pageNum = 1; pageNum <= reader.NumberOfPages; ++pageNum)
{
copy.AddPage(copy.GetImportedPage(reader, pageNum));
}
}
document.Close();
当我使用 提取 PDF 的资源mutool extract
时,它使用的每种字体都有多个相同的副本:
C:\[...]>sha1sum *.cff *.ttf *.png | sort
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0020.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0036.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0049.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0069.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0084.cff
0d150f99593d385764a1c7096b72448d09af8d72 *JPIOAD+Helvetica-0099.cff
17a99e597d3ec2cabf567cbfec032972f7e00962 *DXLQZY+LetterGothicW1Bold-0032.ttf
17a99e597d3ec2cabf567cbfec032972f7e00962 *GMYLDU+LetterGothicW1Bold-0014.ttf
17a99e597d3ec2cabf567cbfec032972f7e00962 *MNVLMO+LetterGothicW1Bold-0045.ttf
[etc.]
我检查了 FontForge 中的 *.cff 和 *.ttf 文件,看起来它们只包含文档中实际使用的字符子集。
有没有办法让生成的文件只包含一个字体副本?