什么是一个好的服务器端 javascript 实现,用于编写一次性脚本来处理某些任务或编写要反复使用的自动化脚本。
我对 SSJS 如此轻松地抓取网页的能力很感兴趣,我认为 SSJS 可以取代 Python 来满足我的通用脚本需求。是否有针对此类事情的 SSJS 实现?
什么是一个好的服务器端 javascript 实现,用于编写一次性脚本来处理某些任务或编写要反复使用的自动化脚本。
我对 SSJS 如此轻松地抓取网页的能力很感兴趣,我认为 SSJS 可以取代 Python 来满足我的通用脚本需求。是否有针对此类事情的 SSJS 实现?
如果您熟悉 jQuery,那么node.js(带有插件“request”、“jsdom”和 jquery 的一个端口)让您只需几行就可以轻松地使用 jQuery 抓取网页。
下面将在您的控制台打印堆栈溢出主页上所有问题的列表:
// Importing required modules
var request = require("request"),
$ = require("jquery");
request({uri: "http://www.stackoverflow.com/"}, function (err, response, body) {
$(body).find("#question-mini-list h3 a").each(function () {
console.log($(this).text());
});
});
或者,如果您在浏览器中使用另一个 javascript 框架,那么创建自己的 MooTools、Prototype 或任何使用 jsdom 的 node.js 端口并不难(只需包装任何库以提供它window
,document
以及其他全局变量 - 其中jsdom
让您访问)。
我是 node.js 的粉丝。尽管它的主要优势在于构建服务器(这显然不是您的意图),但它足够通用,绝对值得一看。
我使用 Rhino + Quartz 取得了不错的成绩