0

我想知道如何使用 JavaScript 完成 PDF 页面的水平滚动。是否更好:

  1. 将 PDF 的页面转换为 HTML 文件,然后在 src="...each page.html"?
  2. 将 PDF 的页面转换为 iframe 之外的其他 HTML 元素(例如,DIV?),然后在包含每个页面内容的元素之间单击左右。

我想确保 PDF 的文本是可搜索的,所以我不想把它的页面变成图像。我也对使用 iframe 持怀疑态度,因为在单个网页中拥有多个 iframe 会带来格式挑战。在使用“PDFtoHTML”基于 linux 的软件将 PDF 转换为 HTML 之后,我已经测试了这种方法,发现通常这是一个次优的解决方案。

似乎选项 2 是要走的路,但不知道如何以编程方式将 PDF 解析为多个 DIV。除了 JavaScript,我熟悉 PHP 和 Linux,但不熟悉其他语言,如果这有助于思考解决方案的话。

4

2 回答 2

0

PDF 插件拦截鼠标事件,因此无法直接从浏览器/JavaScript 控制它。

您的另一种方法,转换为 html,是可行的。

于 2011-10-26T17:56:56.873 回答
0

将 PDF 页面转换为 HTML 文件或多或少与“将其解析为”完全相同<div>。如果您已经找到了可以为您执行此操作的工具(“PDFtoHTML”),只需使用它,然后删除除<body>它输出的 .html 中的内容之外的所有内容。

于 2011-10-26T18:02:22.063 回答