2

我 9 岁的儿子视力非常低,1/10。目前,他学校的支持人员为他提供了教科书的 pdf 扫描件,并为他在 PC 上访问教科书提供了良好的培训。

但是,我认为这并不理想,原因有很多:

  • 大文件(一本地理书是300Mb,做扫描的人不是技术人员)
  • 文字大小只能通过缩放间接控制,我的男孩至少需要 40pt 文字
  • 难以导航,即有很多滚动来回只是为了阅读一个短语,使整个阅读过程有点累。
  • 无法记笔记和/或填写教科书中的答案区域。
  • 无法访问目录/索引/
  • PC 问题(重量/功率/与平板电脑相比完全缺乏冷却)

所以,我认为 html5 的世界对我有一个答案。我希望走向的过程如下:

  • 我扫描教科书并通过像 ABBY
    FineReader 这样的 OCR 程序运行它们。
  • 这给了我原始文本和图像
  • 将这些原始数据转换为 html5 格式,其结构类似于

    <div class="book">
        <div id="TOC"></div> (This TOC will be built dynamically)
        <div class="page" id="1"> (Important to keep the notion of pages to allow him to have the same reference as the rest of the class)
            <div class="text"></div>
            <div class="img"></div>
            <div class="answerzone"></div>
            <div class="footer"></div>
        </div>
    </div>
    
  • 接下来,javascript 启动并添加以下功能

    • 大的、半透明的左右箭头始终显示在屏幕底部角落
    • 大的、半透明的页码总是很明显,例如在右上角
    • 左上角的大半透明符号可访问以下功能
    • 访问目录
    • 增加/减少字体大小
    • 添加一个区域,他可以在其中从键盘或用手写笔在屏幕上书写文本。这个区域可以有一个图像作为背景,例如他需要在答案周围画圈。
    • 他添加的所有内容(文本/图像)都本地存储在平板电脑上

毕竟,这是问题部分。有没有人有类似要求的经验找到了解决方案?我可以做 javascript 的东西(我想我可以)到区域来添加文本/图像并在本地存储所有这些。有没有人可以指出可以满足我需要的现有 html5 解决方案?

此致,

科尔姆

PS我已经离开了整个epub,让我们面对现实吧,它只是html,为什么不使用浏览器而不是电子书阅读器解决方案呢?

4

2 回答 2

1

看看这篇文章:使用 CSS3 构建书籍

那是一篇很棒的文章,它有很多非常有用的技术。显然,您将不得不生成大量 HTML,但使用该文章中介绍的技术,您将不必生成几乎一样多的无用HTML。那篇文章确切地告诉你如何做页码和目录,并且使用 JavaScript 来创建左右箭头来改变页面并不难(当然也可以用 CSS 来设置样式)。

至于注释,我有点困惑你是想把它用于平板电脑还是 PC。如果是用于 PC,我建议使用预构建的工具,例如Zotero。如果它是用于平板电脑的,那么您可能需要稍微靠耳朵来玩,因为您能做或不能做的事情因平板电脑而异。

于 2012-08-27T01:12:29.207 回答
0

这是一个非常困难的问题。最大的问题是从 PDF 中获取智能文本。PDF 没有您将习惯使用 HTML 的结构。它本质上是一张打印到的电子纸。文本排列在视觉上排列的块中,但在文件中可能彼此没有太大关系。

我认为您最好的选择可能是使用Calibre将格式更改为其他格式。结果远非完美,尤其是在像教科书这样复杂的东西中。当您转换一本书时,请确保进入 Heristic Processing 的选项并启用它。

如果 Calibre 不适合您,也可以使用一些库来执行此操作。
itext可免费用于非商业用途,并具有文本提取功能。 pdfbox是免费的,并且还具有文本提取功能。 pdfnet是一个商业产品,但可能有一些你可以使用的东西。

我不确定您是否会获得令人满意的自动化结果。鉴于您只需要处理一个孩子的课程,而不是庞大的 PDF 库,可能值得花时间手动复制每一页。这样,您可以以智能的方式排列文本。

于 2012-09-11T15:12:35.173 回答