2

我正在尝试从http://code.google.com/p/arc90labs-readability/编辑 readability.js 文件。

这是一个小书签,通过删除除网页/网络文章标题和正文之外的所有内容来“清理”当前页面。

但是,我想编辑脚本,以便当小书签处于活动状态时,当前页面保持不变,而是将“清理”的 html 文件输出到指定的本地目录。

任何人都可以帮忙吗?谢谢!

注意:干净的 HTML 文件称为“document.body.innerHTML”

4

2 回答 2

1

首先,不接触原始页面就无法完成。脚本的工作方式是编辑当前页面(因此图像 url 继续工作,等等)。您可以做的最好的事情是存储innerHTML根目录html,然后在您获取内容后恢复它(或单独存储headbody)它看起来像这样:

  1. 首先,您需要存储现有innerHTML元素html
  2. 接下来,您将根据需要运行脚本,只需删除可读性控制部分。
  3. 获取readability-content文档或整个文档的 HTML 内容并将其存储在变量中。
  4. 使用步骤 1 中存储的内容恢复原始内容(使页面恢复到之前的状态)

此时,根据您的浏览器,您可以尝试使用 dataURI,也可以动态添加对Downloadify库、图像等的引用,并将下载按钮添加到页面。最后,单击“下载”按钮,您可以预先提供在步骤 3 中存储的文件名和数据,但每次都必须选择位置。

抱歉,这是假设性的,但是将它们组合在一起需要相当多的工作。

于 2010-01-02T03:30:23.060 回答
0

您实际上不需要修改可读性代码。只需拉取以下内容:

document.getElementById("readability-content");

然后,您可以将其传递到要保存的本地脚本。

于 2010-01-02T02:58:37.540 回答