我想从 epub 文件中为我的文本到语音 iOS 应用程序提取文本。
如果我可以在 iOS 设备中使用一些库来做到这一点,那就太好了,但我也想知道它是否应该在服务器端处理。
有谁知道如何做到这一点?
例如,Voice Dream 从 epub 格式中提取文本。 http://www.voicedream.com/?page_id=134
我想从 epub 文件中为我的文本到语音 iOS 应用程序提取文本。
如果我可以在 iOS 设备中使用一些库来做到这一点,那就太好了,但我也想知道它是否应该在服务器端处理。
有谁知道如何做到这一点?
例如,Voice Dream 从 epub 格式中提取文本。 http://www.voicedream.com/?page_id=134
ePub 是一个带有 XML 清单的 ZIP 文件,其中包含摘要(和一些元数据)并引用一组 HTML(查看规范以了解所有详细信息:http: //idpf.org/epub)如果您想要在设备上执行此操作,您很可能必须编写自己的代码:打开 zip,在清单中找到您的方式来定位您的文本,然后删除所有 HTML 标记以获得纯文本。如果你可以在服务器端做,那就更容易了:你可以使用处理 ePub(和许多其他格式)的 Apache Tika ( http://tika.apache.org/ )。
很难更精确,因为您没有解释如何获得 epub 以及如何选择 epub 的哪个部分将被定位...