我可以使用任何编程语言或库进行此转换吗?
7 回答
简短的回答是肯定的,它可以用任何编程语言完成。
基本步骤:
- 将您的 HTML 转换为 XHTML (+ CSS)。这可以在您的程序中或通过 XSLT 文件完成。
- 将您的文件(XHTML、CSS、任何图像和字体)复制到遵循该格式的目录结构中。
- 压缩目录结构并使用“.epub”扩展名命名存档。
一些可帮助您入门的网站:
- 可以在此处找到有关 epub 文件中的内容(以及如何自己创建文件)的好教程:http: //www.jedisaber.com/eBooks/Introduction.shtml。我用它来开始自己。
- .epub 标准的规格在这里:http ://www.idpf.org/
- .epubs 的验证器可以从这里下载:https ://github.com/IDPF/epubcheck
2015 年 6 月 注意: epubcheck 验证器已从 google 代码移至 GitHub;注意新的 URL。
Calibre支持多种输入格式,包括 HTML,以及多种输出格式,包括 EPUB,但它不是“一种编程语言或库”。您是否有特定的原因需要基于编程的方法而不是独立工具?如果是这样,也许 Python 和ebookmaker.py可以帮助你。
一个迟到的回复,但我发现基于 Python 3 的电子书制作器很有价值,至少在我提交了一个删除 UTF-8 BOM 的拉取请求之后。它的一个问题似乎是它使用脆弱的正则表达式来解析 HTML,但我想我必须在那里报告它。
我正在使用 Aspose 的以下库 - http://www.aspose.com/categories/.net-components/aspose.words-for-.net/default.aspx
只需两行代码,我就可以进行 html 到 epub 的转换。目前在生产系统中使用它。
文档 doc = new Document(_sourceFilePath);
doc.Save(_destinationFilePath, SaveFormat.Epub);
这是epub 的 pdf 文件,我知道这不是您想要的,但这是一个开始。
口径包可能有你想要的
我刚刚开始在 Java 中实现这样的工具(与 OpenJDK 兼容):html2epub。为了摆脱手动编辑配置文件,我可能会启动一个单独的工具来从任何给定目录生成配置文件(但是,仍然需要确定 EPUB 中 XHTML 的顺序 - 对于非- 编程使用,可以考虑开发一个 GUI 辅助工具,对于一个完全灵活的编程解决方案,我还没有想出一个想法)。在此之前,我为自定义 XML 输入(hag2epub 工具)实现了基于 shell 脚本的转换器 - 如果您有兴趣,我可能会将它们移植到 XHTML 输入(使用 EPUB 元数据的配置文件或从最顶层索引获取元数据。目录的 html(如果存在)。
我以前也有同样的问题,因为我想在 iPad 上离线阅读一些网页内容。我不知道,我不是精通电脑的人。有口径或节blabla....
但对我来说,它们只是格式转换器,我需要一个 ePub 图书创建器,它可以让我将许多想要的文档组合在一起阅读。然后我找到了一个书本式的html 到 ePub 转换器,我从网络上保存了 html 页面,然后用它进行转换。它现在对我来说是一个很好的工具。