我想编写让我完全控制将 PDF 转换为 ePUB 的转换器?我正在寻找的是转换器
- - 不应该删减最后一行的单词。如果文本是一个段落,那么 epub 必须是一个段落,没有任何额外的空格字符和剪切词。
- - 应识别 pdf 文档中的书签,并应在 epub 版本中创建目录 (TOC)。
- 应该调整图像的大小。
- 应该是 UTF8,它必须与土耳其字符兼容。
请为此建议我任何图书馆?
我想编写让我完全控制将 PDF 转换为 ePUB 的转换器?我正在寻找的是转换器
请为此建议我任何图书馆?
您可能会发现 Calibre (http://calibre-ebook.com/) 很有用。它支持 PDF 输入、导出到 ePub 并具有命令行实用程序。不过,我怀疑,要实现您想要的,您需要使用标准 PDF 库之一对 PDF 进行预处理,以提取所需的元数据、调整图像大小等。
如果您确实遇到了对 PDF 进行大量预处理的麻烦,您也可以直接编写 ePub,因为这将是一个相对较小的附加步骤,并且消除了对 calibre 或类似内容的依赖。
如果您确实找到了一些好的 PDF-ePub 库,请告诉我们。
我自己没有尝试过,但你可能想看看这个。