1

我想从某个网站收集许多日期和目的地的机票价格。我可以在 URL 上指定来源、目的地和日期,但网站使用 AJAX 获取数据,因此页面响应中的价格并不容易获得。在这种情况下,我可以使用任何编程语言来获取数据。

我认为使用 Web 浏览器一个接一个地加载每个 URL,让它呈现页面,然后我只查找所需的标签(我猜是使用 CSS 选择器或 JS)并保存它,可以更好地完成这项任务到某个文件或日志,然后移动到下一个 URL。稍后我可以查看数据并找到最优惠的价格。

但不幸的是,我找不到任何浏览器扩展/插件来完成这项任务(任何 Linux 浏览器都可以,Firefox 和 Chrome 更有可能)。我已经熟悉 GreaseMonkey,但这不是他设计的任务,但我想这将是一个类似的工具或以类似的方式操作。

有人知道我可以用来完成这项任务的工具吗?也欢迎其他方法!

4

1 回答 1

0

我会使用 cURL,检查页面来源以查看传递给页面的 post/get 数据,然后构建自己的 gui 来显示数据。您可以使用 php curl 非常轻松快捷地在您自己的 Web 服务器上运行它。

于 2012-10-25T21:56:49.623 回答