4

我想知道 A.nnotate.com、Scribd、Google Docs 等服务如何将 pdf、.doc 或任何其他文档呈现为 HTML 以及注释系统如何工作?

4

1 回答 1

5

A.nnotate.com 使用 xpdf 在给定缩放级别将 PDF 页面转换为 PNG 图像的服务器端 - 这些是在浏览器中显示的内容。

文本突出显示是通过从 PDF 中提取文本位置,然后在页面图像顶部添加一个透明覆盖层,并在单词顶部使用绝对定位的 html DIVS 来完成的。注释然后使用 ajax gui 将注释附加到突出显示的文本。

其他格式(MS Word、PPT 等)首先使用 openoffice 转换为 PDF,然后像 PDF 一样转换为图像和文本覆盖。

我认为其他 HTML 文档站点在将 PDF 呈现为 HTML 时会做类似的事情(即页面图像 + 文字覆盖作为透明 div) - 另一种技巧是将 PDF 嵌入字体转换为 HTML5 CSS 字体,并为文本使用绝对定位的 div(并提取和定位图像)。

于 2011-07-25T14:07:47.537 回答