作为我的第一个 python 编码项目,我想使用 python 从 BMJ 等期刊中的文章创建 epub 文件。
我从BMJ RSS 中提取链接feedparser
,使用beautifulsoup
来捕获我需要的 html 文件中的组件,然后按照链接中的说明创建一个 epub 文件。
可以创建EPUB文件,但不是一些epub阅读器认为文件损坏,例如windows和android的coolreader什么都不显示,而android版本甚至意外退出程序。
我猜 epub 的一些“声明”是不正确的,导致这个问题,但我不知道如何解决它。
我在 R 中有一些编码经验,并使用该XML
包进行了一些网络抓取,但没有 EPUB 格式的经验。