1

我想使用 Readability 的 javascript 来清理新闻文章,然后下载生成的文章。这意味着能够执行他们的 js 代码:

window.baseUrl          = 'https://www.readability.com';
window.readabilityToken = '';

var s = document.createElement('script');

s.setAttribute('type','text/javascript');
s.setAttribute('charset','UTF-8');
s.setAttribute('src', baseUrl + '/bookmarklet/read.js');

document.documentElement.appendChild(s);

在不同于传统网络浏览器的环境中。例如,这可以通过在使用 Firebug 的站点上执行上述代码来实现;我想通过 Java(没有浏览器)模拟该功能。我在这里看到的问题之一是“窗口”对象,它在以编程方式访问页面时可能不存在。

关于这是否可能以及如何实施的任何提示?

4

1 回答 1

2

看一下无头浏览器,例如EnvJS

于 2012-06-29T20:22:41.757 回答