0

我正在做一个下载管理器。我想让下载管理器在下载文件后检查 url 的 md5 哈希。哈希值在页面上找到。它需要计算文件的 md5(已完成),在 html 页面上搜索匹配项,然后比较 html 页面的全部内容以找到匹配项。

我的问题是如何让 python 返回 html 的全部内容并找到我的“md5 字符串”的匹配项?

4

2 回答 2

3

Requests lib 是您想要使用的。将为您省去很多麻烦

于 2013-02-11T16:13:33.177 回答
1

import urlliburllib.urlopen用于获取 html 的内容。import re使用正则表达式搜索哈希码。您也可以find在字符串上使用方法而不是正则表达式。

如果您遇到问题,那么您可以提出更具体的问题。你的问题太笼统了。

于 2013-02-11T16:05:14.580 回答