语境:
我正在尝试编写一个“机器人”来对该站点进行查询。问题之一是,结果显示在一个没有出现在 HTML 中的“框架”中,在我看来它就像一个“Java 虚拟机”或其他什么。
问题:
主要问题(将验证码识别放在一边,因为我们之前已经做过)是我找不到在网站上“检索/提取”查询结果数据的方法。
我已经手动爬取了 HTML,试图至少找到那里发生的事情的线索,但似乎我没有足够的专业知识来弄清楚结果是如何显示的。
Fiddler 表明,对虚拟机的请求返回一种“加密”信息,我不知道如何“解密”。
Fiddler Request (jar) : GET http://www.brasiltelecom.com.br/portal/pf/102online/Applet102PConv.jar
Fiddler Request with encripted Return : GET http://www.brasiltelecom.com.br/portal/Consultar102OnlineServlet?nome=9E10EB3AEF707099&endr=B48A41A90FCA933A&bair=B48A41A90FCA933A&locl=4A8DEF5F7E4C714B&tipo=1&secure=334265
翻译的第二个请求的参数:
nome = name
endr = Address
bair = neighborhood
locl = location
Tipo = always 1
secure = captcha
只是为了更好地理解上下文。
工具:
目前,我正在使用 Visual Studio 2010 (IDE)、Fiddler (Web 调试器) 和内部库 (dll) 来简化流程。
问题:
如何使用 C# 应用程序以编程方式提取屏幕上显示的信息?
有什么方法可以“解密”网络请求返回的信息,或者至少找到服务使用的“密钥”或“方法”作为开始解密的第一步?
在此先感谢,我希望我已经说清楚了,如果我能做些什么来改善这个问题,请告诉我。
和平 !