0

我正在尝试从使用 ajax 和会话以及 POST 变量进行数据导航和显示的 asp、jsp 站点中抓取数据。我已经阅读了各种文章和 SO 进行数据抓取,但没有太大帮助我解析了一些带有修改标头的网站,但大多数网站都显示了我的自定义标头的标头重定向。什么是从启用了 javascript 的站点解析数据的正确方法,并且在 asp 中的站点具有 viewstate 变量。

4

1 回答 1

3

如果你想学习网络爬虫,我建议你读那本书

在此处输入图像描述

Webbots、Spiders 和 Screen Scraper:使用 PHP/CURL 开发 Internet 代理的指南

这确实是唯一一本专门为 php 开发人员编写的网络爬虫的书,但我认为这本书所教的基础知识将帮助任何开发人员了解网络机器人的工作原理

我还通过电子邮件向作者发送了一些问题,他在几分钟内回复了我真的我强烈建议任何想了解网络抓取的人阅读这本书

于 2013-02-18T03:17:57.633 回答