MarkLogic 不“处理”EPUB。公积金没有。MLCP 没有。
EPUB 是一个 zip,主要包含 xhtml、xml 和图片。我可以将它重命名为 .zip 并使用 MLCP 加载它。但是重命名不是很好,除非我在 URI 创建等中添加替换,否则它将显示在 URI 中。
此外,该.opf
文件包含有用的信息,它是 XML,但读取为二进制。我可以将 .OPF 添加到 MIME 类型,但这不能与使用 MLCP 从存档加载相结合,然后它仍会再次显示为二进制。
我不想在数据加载到 ML 之前添加一个额外的层来“准备”数据。而且我想尽可能地保持信息的可读性/可索引性。
有没有比这更好的方法;重命名、解包和模拟输入以将 EPUB 文件加载到 MarkLogic 中?