5

在使用 .NET 的HttpWebRequest/Response对象之后,我宁愿自己开枪也不愿用它来爬取网站。我正在寻找一个现有的 .NET 库,它可以获取 URL,并让您能够跟踪链接、提取/填写/提交页面上的表单等。PerlLWPWWW::Mechanize模块做得很好,但我正在工作使用 .NET 项目。

我遇到了HTML Agility Pack,它看起来很棒,但它没有模拟链接/表单。

这样的工具是否已经存在?

4

1 回答 1

2

有人构建了一些代码作为 HTML Agility Pack(我也很喜欢)的插件运行,它允许您进行一些表单修补:

http://apps.ultravioletconsulting.com/projects/uvcwebtransform/docs/class_html_agility_pack_1_1_add_ons_1_1_form_processor_1_1_form_processor.html

我读过一篇评论说它不是 WWW::Mechanize,但这是一个很好的开始。提供了代码,因此您可以轻松扩展它。

于 2008-09-23T19:08:40.613 回答