1

我的客户希望我们为他们的应用程序构建一个自定义文档查看器。(真的,真的需要定制,因为他们需要大量特定于应用程序的功能。)

去年我们为他们构建了一个,它获取 PDF、生成页面图像,并使用可以选择和复制的隐藏文本层支持图像。我们在 Flex 中做到了。这是一场噩梦。PDF是可怕的。

今年,我们需要在 HTML 5 中构建一个具有类似要求的文档,只是现在大多数文档都是 Word 或 HTML 格式,即它们具有可重排的文本,而不是 PDF 的固定布局和字形。但他们仍然想在同一个查看器中制作 PDF。

我在想我们需要将所有文档转换为一些通用的文件格式,既可以处理可重排的文本,也可以处理 PDF 的固定位置字形。(每个文件都可能支持其中一个,但不能同时支持两者)。如果它是一种类似 XML 的标记语言会说:

<text>here's some text</text>

-- or -- 

<glyph letter="a" name="my_a_glyph" position="10,10"/>
<image src="my_image" position="20,20"/>

或类似的东西。

是否有任何现有的文件格式可以处理它?EPUB 不会做固定位置的文本,而 PDF 用太多的方式来描述。

4

2 回答 2

0

我想你可以看看 FB2 (FictionBook 2) 格式。这是一种基于 XML 的格式,专为出版书籍而设计。它包括图像,但我不确定它们是否可以绝对对齐。

此外,您可以简单地使用 HTML 并在需要时进行 HTML 到 PDF 的渲染(为此存在各种组件和库)。我没有看到(或者您没有列出)这种方式不起作用的任何原因。

于 2011-01-19T22:17:55.937 回答
0

格罗夫?可以根据需要构建一个宏库来定制它。

Groff/troff/nroff,Unix 的“run off”程序,可以输出到 postscript 或 HTML。一些 PDF 查看器内置了从 postscript 到 PDF 的跳转;还有几个现有的程序,例如 pstopdf。

GROFF 有一些固定的布局选项和一些类似流的选项。使用 GROFF,几乎可以更轻松地将大部分打印输出建立在限制范围内的流动文本上。

于 2011-01-19T23:09:40.233 回答