0

首先,这是一个合法的请求。我需要在我们的 Intranet 上获取网站的 ower id。我需要查找大约 3000 人,所以与其手动单击每个站点并查看 ID、复制并粘贴到我的 Excel 工作表中,我想我只需遍历列表(我已经拥有)和屏幕抓取所有者 ID。我想我会构建一个 cf 页面来获取页面并将生成的内容存储到数据库中。我想做的是从返回的页面中删除所有其他内容并仅保留所有者 ID 值。在下面的代码中,我要查找的值是 tb1245。这是返回的结果内容:

<table>
<tr>
    <td>Site/Folder Name:</td>
    <td>AppliedScien<td>
</tr>
<tr>
    <td>Vanity URL:</td>
    <td>N/A</td>
</tr>
<tr>
    <td>Owner ID:</td>
    <td>tb1245
</tr>
<tr>
    <td>Owner Name:</td>

            <td>
                <a style="font-family: ariel">Tom W&nbsp;BEST&nbsp;(tb1245)&nbsp;</a>
                <a style="font-family: 'Wingdings'; font-size: 12pt; color: blue;" href="mailto:tb1245@us.domain.com">*</a>&nbsp;
                <a style="font-family: 'Wingdings'; font-size: 12pt; color: blue;" href="javascript:webPhone('tb1245')">(</a>
            </td>

    </tr>

    <tr>
        <td>Web/Server Admin:</td>
        <td>

                    <a style="font-family: ariel">Ohtro J&nbsp;Pepper&nbsp;(tc6139)&nbsp;</a>
                    <a style="font-family: 'Wingdings'; font-size: 12pt; color: blue;" href="mailto:ot9533@swmail.domain.com">*</a>&nbsp;
                    <a style="font-family: 'Wingdings'; font-size: 12pt; color: blue;" href="javascript:phonebook('ot9533')">(</a>

        </td>
    </tr>

有人可以帮我弄这个吗?我应该在星期五之前完成它,但男人是这项令人麻木的工作,所以我宁愿通过冷融合来完成它并给我的老板留下深刻印象。:D

TIA

4

1 回答 1

1

因此,假设您有 3000 个正在循环的 URL 列表。对于其中的每一个:

使用 CFHTTP 获取内容。它在 cfhttp.fileContent 中返回。

然后,您需要使用正则表达式对其进行解析以提取该 ID。这对我有用你的内容:

<cfoutput>
ID: #reReplaceNoCase(cfhttp.fileContent, ".*<tr>\s*<td>Owner ID:</td>\s*<td>([a-z0-9]+)\s*</tr>.*", "\1")#
</cfoutput>
于 2013-11-13T16:53:38.483 回答