我想获取网站上显示的当前验证码。这方面的一个例子是 http://top100arena.com/in.asp?id=58978
除了右键单击->在新页面中打开图像之外,我如何获取显示的验证码的图像链接?
我想获取网站上显示的当前验证码。这方面的一个例子是 http://top100arena.com/in.asp?id=58978
除了右键单击->在新页面中打开图像之外,我如何获取显示的验证码的图像链接?
您正在寻找由以下标识的 div "rechapta_image"
:
然后提取src
这个div里面img元素的属性。
为此,您可以选择简单的基于字符串操作的方式或使用 HTML 解析库(如JSoup)。
以下是此类提取 URL 的示例:
实际上,chapta box 似乎是一个 iframe。因此,使用包含“chapta”的 src 字符串搜索 iframe。这种 iframe 的示例:
<iframe src="http://www.google.com/recaptcha/api/noscriptk=6LeyFroSAAAAAJTmR7CLZ5an7pcsS5eJ3wEoWHhJ"
height="300" width="500" frameborder="0"></iframe><br/>
因此,一旦您提取了该 URL,请再次使用 JSoup 来查找图像的 URL。获取的页面有这样的一部分:
所以,寻找一个中心元素,并从中取出 img 元素。
尝试在 firefox https://addons.mozilla.org/es/firefox/addon/firebug/中使用 Firebug ,它易于使用,在红色部分您会找到一个名为 Image 的标签,您会在那里找到图像。