我的客户希望我们为他们的应用程序构建一个自定义文档查看器。(真的,真的需要定制,因为他们需要大量特定于应用程序的功能。)
去年我们为他们构建了一个,它获取 PDF、生成页面图像,并使用可以选择和复制的隐藏文本层支持图像。我们在 Flex 中做到了。这是一场噩梦。PDF是可怕的。
今年,我们需要在 HTML 5 中构建一个具有类似要求的文档,只是现在大多数文档都是 Word 或 HTML 格式,即它们具有可重排的文本,而不是 PDF 的固定布局和字形。但他们仍然想在同一个查看器中制作 PDF。
我在想我们需要将所有文档转换为一些通用的文件格式,既可以处理可重排的文本,也可以处理 PDF 的固定位置字形。(每个文件都可能支持其中一个,但不能同时支持两者)。如果它是一种类似 XML 的标记语言会说:
<text>here's some text</text>
-- or --
<glyph letter="a" name="my_a_glyph" position="10,10"/>
<image src="my_image" position="20,20"/>
或类似的东西。
是否有任何现有的文件格式可以处理它?EPUB 不会做固定位置的文本,而 PDF 用太多的方式来描述。