javascript - 寻求帮助在 html5 中指定教科书格式，专门用于平板电脑，包括记笔记

Question

我 9 岁的儿子视力非常低，1/10。目前，他学校的支持人员为他提供了教科书的 pdf 扫描件，并为他在 PC 上访问教科书提供了良好的培训。

但是，我认为这并不理想，原因有很多：

大文件（一本地理书是300Mb，做扫描的人不是技术人员）
文字大小只能通过缩放间接控制，我的男孩至少需要 40pt 文字
难以导航，即有很多滚动来回只是为了阅读一个短语，使整个阅读过程有点累。
无法记笔记和/或填写教科书中的答案区域。
无法访问目录/索引/
PC 问题（重量/功率/与平板电脑相比完全缺乏冷却）

所以，我认为 html5 的世界对我有一个答案。我希望走向的过程如下：

我扫描教科书并通过像 ABBY
FineReader 这样的 OCR 程序运行它们。
这给了我原始文本和图像

将这些原始数据转换为 html5 格式，其结构类似于

<div class="book">
    <div id="TOC"></div> (This TOC will be built dynamically)
    <div class="page" id="1"> (Important to keep the notion of pages to allow him to have the same reference as the rest of the class)
        <div class="text"></div>
        <div class="img"></div>
        <div class="answerzone"></div>
        <div class="footer"></div>
    </div>
</div>

接下来，javascript 启动并添加以下功能
- 大的、半透明的左右箭头始终显示在屏幕底部角落
- 大的、半透明的页码总是很明显，例如在右上角
- 左上角的大半透明符号可访问以下功能
- 访问目录
- 增加/减少字体大小
- 添加一个区域，他可以在其中从键盘或用手写笔在屏幕上书写文本。这个区域可以有一个图像作为背景，例如他需要在答案周围画圈。
- 他添加的所有内容（文本/图像）都本地存储在平板电脑上

毕竟，这是问题部分。有没有人有类似要求的经验找到了解决方案？我可以做 javascript 的东西（我想我可以）到区域来添加文本/图像并在本地存储所有这些。有没有人可以指出可以满足我需要的现有 html5 解决方案？

此致，

科尔姆

PS我已经离开了整个epub，让我们面对现实吧，它只是html，为什么不使用浏览器而不是电子书阅读器解决方案呢？

score 1 · Accepted Answer

看看这篇文章：使用 CSS3 构建书籍

那是一篇很棒的文章，它有很多非常有用的技术。显然，您将不得不生成大量 HTML，但使用该文章中介绍的技术，您将不必生成几乎一样多的无用HTML。那篇文章确切地告诉你如何做页码和目录，并且使用 JavaScript 来创建左右箭头来改变页面并不难（当然也可以用 CSS 来设置样式）。

至于注释，我有点困惑你是想把它用于平板电脑还是 PC。如果是用于 PC，我建议使用预构建的工具，例如Zotero。如果它是用于平板电脑的，那么您可能需要稍微靠耳朵来玩，因为您能做或不能做的事情因平板电脑而异。

score 0 · Accepted Answer

这是一个非常困难的问题。最大的问题是从 PDF 中获取智能文本。PDF 没有您将习惯使用 HTML 的结构。它本质上是一张打印到的电子纸。文本排列在视觉上排列的块中，但在文件中可能彼此没有太大关系。

我认为您最好的选择可能是使用Calibre将格式更改为其他格式。结果远非完美，尤其是在像教科书这样复杂的东西中。当您转换一本书时，请确保进入 Heristic Processing 的选项并启用它。

如果 Calibre 不适合您，也可以使用一些库来执行此操作。
itext可免费用于非商业用途，并具有文本提取功能。 pdfbox是免费的，并且还具有文本提取功能。 pdfnet是一个商业产品，但可能有一些你可以使用的东西。

我不确定您是否会获得令人满意的自动化结果。鉴于您只需要处理一个孩子的课程，而不是庞大的 PDF 库，可能值得花时间手动复制每一页。这样，您可以以智能的方式排列文本。

javascript - 寻求帮助在 html5 中指定教科书格式，专门用于平板电脑，包括记笔记

2 回答 2

Related

Reference