2

所以我正在制作一个类似于网络爬虫的程序。它下载页面的 html 并使用正则表达式将其解析为特定文本,然后将其添加到列表中。

为此,我使用了异步 http 请求。GET请求是异步发送的,对返回的html进行解析操作。

我的问题,我不确定它是否简单,是程序运行不顺畅。它会发送一堆请求,暂停几秒钟,然后一次递增所有解析的项目(尽管计数器被编程为每次添加项目时递增一次),例如它从 53 跳转到 69 而不是显示, 54,55,56,...

很抱歉成为新手,但我自学了所有这些东西,一些经验丰富的建议会大有帮助。

谢谢

4

1 回答 1

4

听起来是对的。

您任务中最慢的部分是通过网络下载页面。

您的程序开始一次下载一堆页面,等待它们到达,然后几乎立即解析它们。

于 2012-05-17T03:14:25.307 回答