0

我想从 epub 文件中为我的文本到语音 iOS 应用程序提取文本。

如果我可以在 iOS 设备中使用一些库来做到这一点,那就太好了,但我也想知道它是否应该在服务器端处理。

有谁知道如何做到这一点?

例如,Voice Dream 从 epub 格式中提取文本。 http://www.voicedream.com/?page_id=134

4

1 回答 1

3

ePub 是一个带有 XML 清单的 ZIP 文件,其中包含摘要(和一些元数据)并引用一组 HTML(查看规范以了解所有详细信息:http: //idpf.org/epub)如果您想要在设备上执行此操作,您很可能必须编写自己的代码:打开 zip,在清单中找到您的方式来定位您的文本,然后删除所有 HTML 标记以获得纯文本。如果你可以在服务器端做,那就更容易了:你可以使用处理 ePub(和许多其他格式)的 Apache Tika ( http://tika.apache.org/ )。

很难更精确,因为您没有解释如何获得 epub 以及如何选择 epub 的哪个部分将被定位...

于 2013-06-18T10:15:10.273 回答