3

下午好。这里有一个托管公告的网站 我需要在任何公告的页面上获取电话号码,例如这里 的电话号码表示为图片。我想获取图片的链接并保存这张图片并识别这张图片。但是当我开始在我的程序中获取图片的链接时,我看到这张图片生成了java脚本。这是我试图在我的程序中获取图片链接的代码:

.....
HtmlNode bodyNode7 = doc.DocumentNode.SelectSingleNode(@".//*//table[6][@class='objectView']//tr[2]//td");
Console.WriteLine(bodyNode7.InnerText.ToString());
.....

我使用 HtmlAgilityPack 库 (C#) 来解析图片链接。我打开了这个页面的源代码(这里),看到了生成图片的 Javascript:

<tr id="ctl00_cphBody_FlatSell_Obj_adapterObject_trPhones" style="background-color: white">
        <th>Телефоны:</th>
        <td>
                    <script language="javascript" type="text/javascript">document.write(decs("0x88e36b6d468b03acca9737a99ba0fffe05cb3a53de8858b798194826c94719e2193434b3377d69745a1a28879291ecfd69c703de931ac8f551fe22229ef49160"));</script>
        </td>
</tr>

在 javascript 中使用函数 decs() 来生成图片。这是代码:

function decs(a){
return deco(key,hexToString(a),0,1,iv)
};

如果我理解正确的话,这个函数创建了一个带有电话号码的图片的链接,或者这个函数创建了这个图片。在这种情况下,该函数使用参数“key”。如何创建这个参数,我不知道。

问题:如何在我的程序中获取带有电话号码的图片的链接或下载带有电话号码的图片?

4

1 回答 1

1

你有几个选择。一种是使用像 OpenWebkitSharp 这样的库,它在您的 .NET 应用程序中托管 Webkit 的实例,您可以使用它来执行页面上的任何脚本,然后检查生成的 DOM 以提取图像。该库位于此处:http ://code.google.com/p/open-webkit-sharp/

然而,在您的应用程序中托管 webkit 意味着它需要一段时间才能加载并且会消耗大量内存。您需要经常修补 webkit 的更新,几乎每周都会发布。

另一种选择,假设页面的 HTML 和 Javascript 保持不变,是使用正则表达式提取特征,然后自己进行转换。

您将有一个正则表达式,它可以找到“ decs(”文本并在之后提取十六进制编码的文本,然后将其输入到您自己的decs函数实现中,这应该很容易做到。

HTH。

于 2013-01-20T08:56:33.440 回答