我有一个(前)同事几年前用 Jaxer 写的旧工具,我想替换/重写。
Jaxer是一个(废弃的)服务器端框架,基于无头 Mozilla/Gecko-Browser,允许您使用 JavaScript 和 DOM 服务器端。
由于 Jaxer 已被废弃,并且我在新计算机上安装和运行带有 Jaxer 的 Aptana Studio 1.5 时遇到了很大问题,因此我正在寻找一个库/框架/东西,我可以在此基础上创建一个新版本。
此工具仅在 Aptana Studio(Jaxer 的 IDE)中本地运行,并且从未打算成为实际的 Web 应用程序。它通过将我们的客户网站逐页加载到服务器端 Mozilla 中来抓取它们。为了做到这一点,它使用 jQuery 和预定义的 CSS 选择器来查找菜单中的链接并解析页面中的其他信息。最终的结果基本上是一个美化的站点地图。
如果可能的话,我想保留这个作案手法并继续使用 jQuery/JavaScript/DOM 来加载和解析/访问页面,但它可以包装在基于另一种语言(如 Java)的框架中。我考虑过自己写一些基于 Gecko 的东西,但这似乎有点过头了,所以我愿意接受其他建议。