我正在使用GemBox.Pdf,我需要将 PDF 文件中的各个章节提取为单独的 PDF 文件。
第一页(可能还有第二页)包含 TOC(目录),我需要根据它拆分其余的 PDF 页面:
此外,那些被拆分的 PDF 文档应该被命名为它们包含的章节。我可以根据每个文档的页数拆分 PDF(我用这个例子
弄清楚了):
using (var source = PdfDocument.Load("Chapters.pdf"))
{
int pagesPerSplit = 3;
int count = source.Pages.Count;
for (int index = 1; index < count; index += pagesPerSplit)
{
using (var destination = new PdfDocument())
{
for (int splitIndex = 0; splitIndex < pagesPerSplit; splitIndex++)
destination.Pages.AddClone(source.Pages[index + splitIndex]);
destination.Save("Chapter " + index + ".pdf");
}
}
}
但我不知道如何阅读和处理该目录并根据其项目合并章节拆分。