0

我需要从交互式Web 应用程序中筛选某些信息;更重要的是,一旦该 Web 应用程序的用户提交(大概是发布)该表单,我必须从表单中筛选该信息。

我对此有什么选择或选择?

解决方案必须是微创的,即我不能依赖 Fiddler;它还需要占用空间小(即我不能安装太多的第 3 方应用程序或工具来完成此任务)。

将被屏幕抓取的数据将与在桌面系统的后台运行的 C# 应用程序绑定在一起。这是一个基于 Windows 的桌面系统。

只要满足上述约束条件,我对基于非 C# 的解决方案(例如 Ruby、Python 等)完全开放。

4

2 回答 2

0

对于 c# 有 htmlagilitypack,但如果是我,我会使用 ruby​​ mechanize 或 watir/selenium

于 2012-07-05T23:23:17.513 回答
0

我不确定我是否正确理解了您的要求,但既然您了解 Ruby,我相信使用 Mechanize 就足够了。它是一个非常强大的网络自动化库,也易于设置。

您可以查看这篇文章,了解如何在 Windows 上进行设置:

http://webmites.org/ruby-mechanize-web-scraping-made-easy/

您可以在此处参考 Mechanize 文档:

http://mechanize.rubyforge.org/GUIDE_rdoc.html

于 2012-07-06T07:31:34.907 回答