1

承包商向我们提供了一组商店的调查数据。数据包含商店编号、缩略图和大图。数据通过承包商的安全网站访问。为了构建数据报告,我试图从网站上抓取商店编号和图像,而不是手动下载每个图像。

我没有将 CFhttp 用于安全站点,但到目前为止已经取得了一些成功:

<cfhttp 
    method="post" 
    url="http://www.website.com/impart/client_login.php"
    throwonerror="Yes"
    redirect = "yes"
    resolveUrl = "yes">

    <cfhttpparam name="user" value="myUsername" type="formfield">
    <cfhttpparam name="pass" value="myPassword" type="formfield">
    <cfhttpparam name="submit" value="Login" type="formfield">

如何从通过身份验证进入包含要下载的图像的页面?

4

2 回答 2

1

我认为 CFHTTP 可能不是最好的选择。我擅长 BASH,所以我倾向于用 curl 编写脚本,但也许这个页面上的某些产品会更容易http://www.timedicer.co.uk/web-scraping

于 2012-01-05T21:26:15.317 回答
0

cfhttp 范围的转储是什么样的?具体来说,什么是状态码?

如果您获得 200 的状态代码,则需要在抓取每个图像时维护会话。请参阅以下内容:

http://www.bennadel.com/blog/725-Maintaining-Sessions-Across-Multiple-ColdFusion-CFHttp-Requests.htm

http://www.bennadel.com/projects/cfhttp-session.htm

请参阅此问题以通过 CFHTTP 保存图像:

使用 Coldfusion 将图像从 CFHTTP 文件内容转换为二进制数据

于 2012-01-05T21:00:54.157 回答